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“计算 机 组 成 原理 ?和 "计算 机 系统 结构 ?是 计算 机 学 科 各 专业 的 核心 基础 课 。 有 些 高 校 
将 两 门 课程 分 开 来 上 ,也 有 些 高 校 针 对 单 处 理 器 计算 机 系统 开设 了 一 门 “计算 机 组 成 与 系统 
结构 ”课程 ,而 针对 多 核 处 理 器 、 多 处 理 器 计算 机 、 并 行 计算 机 等 高 级 体系 结构 的 内 容 专门 开 
设 一 门 “高 级 体系 结构 ”课程 。 不 管 如 何 设置 课程 ,计算 机 组 成 与 计算 机 系统 结构 涉及 的 基 
本 内 容 都 是 一 样 的 ,这 些 内 容 位 于 软 、 硬 件 结合 处 ,不 仅 涉及 到 计算 机 硬件 设计 、 计 算 机 指令 
系统 设计 ,还 涉及 到 操作 系统 、 编 译 器 和 高 级 语言 程序 设计 等 部 分 软件 设计 技术 ,因此 ,相关 
内 容 是 整个 计算 机 系统 中 最 核心 的 部 分 。 

2010 年 4 月 由 清华 大 学 出 版 社 出 版 的 由 作者 编写 的 主教 材 (计算 机 组 成 与 系统 结构 》 
主要 针对 单 处理 器 计算 机 系统 的 组 成 与 系统 结构 涉及 的 相关 内 容 进行 介绍 。 为 了 让 学 生 更 
好 地 理解 基本 概念 和 基本 原理 ,在 主教 材 编写 时 ,采用 了 “基本 原理 和 实现 细节 相 结合 ,历史 
发 展 过 程 和 现实 实际 情况 相 结合 ”的 方针 ,力求 使 学 生 能 够 全 面 、 系 统 、 准 确 、 牢 固 地 掌握 相 
关 知 识 。 因 而 ,使 得 主教 材 的 内 容 涵 盖 面 广 、 细 节 内 容 较 多 、 篇 幅 较 大 ,给 教材 的 使 用 带 来 一 
些 困 难 。 

为 了 更 好 地 协助 主讲 老师 用 好 主教 材 , 作 者 编写 了 本 辅助 教材 ,对 主教 材 中 每 一 章 的 内 
容 进 行 了 概括 总 结 , 给 出 了 以 下 6 个 方面 的 教学 辅助 内 容 。 

(1) 教学 目标 和 内 容 安排 :给 出 相应 章节 的 教学 总 体 目标 和 基本 教学 要 求 , 并 比较 详细 
地 说 明 课堂 教学 内 容 和 学 生 课 后 阅读 内 容 的 安排 ,以 及 每 章 的 主要 教学 思路 或 教学 方法 。 

(2) 主要 内 容 提 要 :对 主教 材 中 相应 章节 内 容 进行 浓缩 ,形成 主干 知识 框架 结构 ,便于 
学 生 将 全 书 内 容 串 接 起 来 ,形成 本 课程 的 知识 框架 体系 。 

(3) 基本 术语 解释 :给 出 相关 章节 所 涉及 的 基本 术语 的 解释 说 明 , 并 给 出 名 词 术语 的 中 
英文 对 照 。 

(4) 常见 问题 解答 :提供 了 大 量 的 常见 问题 ,并 给 出 对 每 个 问题 的 解释 说 明 。 这 些 常见 
问题 是 作者 在 长 期 的 教学 过 程 中 发 现 的 普遍 存 在 于 学 生 中 的 共性 问题 。 

(5) 单项 选择 题 :提供 了 相应 章节 内 容 的 单项 选择 练习 题 及 其 参考 答案 。 

〈6) 分 析 应 用 题 :提供 了 相应 章节 内 容 的 分 析 应 用 题 及 其 分 析 解 答 。 

单项 选择 题 和 分 析 应 用 题 两 个 方面 的 教学 辅助 内 容 ,主要 是 为 了 巩固 学 生 所 学 的 基本 
原理 而 设置 的 。 通 过 对 一 些 具体 问题 的 分 析 ,能 够 提高 学 生 对 基本 原理 的 认识 。 

本 书 作 为 主教 材 的 教学 辅助 资料 ,可 以 与 主教 材 配套 使 用 。 同 时 ,本 书 相 对 独立 、 自 成 
体系 ,因此 也 可 单独 使 用 。 既 可 作为 “计算 机 组 成 原理 ”或 “计算 机 组 成 与 系统 结构 ”课程 的 


计算 机 组 成 与 系统 对 欧 习 题解 答 与 裘 学 持 蛙 


教师 参考 书 , 也 可 作为 学 生 学 习 “ 计 算 机 组 成 原理 ”或 “计算 机 组 成 与 系统 结构 ”课程 时 的 学 
习 参 考 书 。 

在 本 书 的 编写 过 程 中 ,得 到 了 杨 若 瑜 副教授 的 大 力 协 助 , 从 书稿 的 篇 章 结构 到 内 容 各 方 
面 都 提出 了 许多 宝贵 的 意见 ,并 对 全 书 内 容 进 行 了 全 面 细致 的 核查 和 校对 。 此 外 , 黄 宜 华 教 
授 、 武 港 山 教 授 等 也 对 本 书 提出 了 许多 宝贵 的 意见 。 杨 晓 亮 \ 肖 寿 、 翁 基 伟 、 刘 长 辉 ` 宗 恒 、 莫 
志 刚 、 叶 俊杰 等 研究 生 对 相关 章节 的 内 容 和 习题 分 别 进行 了 校对 和 试 做 ,并 提出 了 许多 宝贵 
的 意见 和 修改 建议 。 在 此 对 以 上 各 位 老师 和 研究 生 一 并 表示 衷心 的 感谢 。 

由 于 计算 机 组 成 与 系统 结构 相关 的 基础 理论 和 技术 在 不 断 发 展 ,新 的 思想 、 概 念 、 技 术 
和 方法 不 断 涌现 ,加 之 作者 水 平 有 限 ,在 编写 中 难免 存在 不 当 或 遗漏 之 处 , 恩 请 同行 专家 和 
广大 读者 对 本 书 的 不 足 之 处 给 予 指正 ,以便 在 后 续 的 版 本 中 予以 改进 。 在 主教 材 或 本 教材 
使 用 过 程 中 车 有 任何 问题 ,都 可 与 作者 直接 联系 ,联系 方式 :cfyuan@nju. edu. cn。 


作者 于 南京 
2011 年 元 月 
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二 二 到 
计算 机 系统 概论 


1.1 教学 目标 和 内 容 安排 


主要 教学 目标 : 

概要 了 解 整 个 计算 机 系统 全 貌 以 及 本 课程 内 容 在 计算 机 系统 中 的 位 置 ,并 使 学 生 掌握 
如 何 简单 评价 计算 机 系统 的 性 能 。 

基本 学 习 要 求 : 

(1) 简单 了 解 计算 机 的 发 展 历程 .计算 机 分 代 标 志 、 摩 尔 定律 的 内 容 。 

(2) 了 解 计算 机 系统 中 硬件 和 软件 的 基本 概念 及 其 相互 关系 。 

(3) 了 解 冯 。 诺 依 曼 结构 计算 机 的 特点 ,以 及 计算 机 硬件 的 基本 组 成 和 各 部 件 功能 。 

(4) 了 解 计 算 机 软件 的 分 类 ,以 及 各 类 系统 软件 和 应 用 软件 的 功能 。 

(5) 了 解 程序 开发 和 执行 过 程 ,理解 各 种 语言 处 理 程序 (翻译 程序 编译 程 序 、 汇 编程 
序 ) 的 概念 。 

(6) 理解 计算 机 系统 的 层次 化 结构 。 

(7) 了 解 各 类 计算 机 用 户 在 计算 机 系统 中 所 处 位 置 ,以 及 本 课程 在 计算 机 系统 中 所 处 
位 置 。 

(8) 了 解 如 何 对 计算 机 的 性 能 进行 测量 和 评价 。 

(9) 了 解 有 哪些 因素 会 影响 计算 机 的 性 能 。 


本 章 涉及 的 内 容 是 计算 机 学 科 最 基本 的 概念 和 知识 ,虽然 没有 特别 难 懂 的 部 分 ,但 是 ， 
对 于 低 年 级 学 生来 说 ,有 些 概念 还 是 比较 抽象 和 难以 理解 的 ,需要 在 对 后 面 章节 的 不 断 学习 
过 程 中 ,去 深化 对 它们 的 理解 并 熟练 运用 。 遇 到 这 些 内 容 时 ,可 以 告诉 学 生 相 关内 容 在 后 面 
具体 哪个 章节 中 会 详细 介绍 。 

本 章 有 关 计 算 机 发 展 历程 的 部 分 内 容 中 ,出 现 了 许多 学 生 难 以 理解 的 专业 术语 ,因此 ， 
这 部 分 内 容 可 以 跳 过 不 讲 , 但 是 ,对 于 冯 “' 诺 依 曼 计算 机 结构 的 特点 “存储 程序 ”工作 方式 、 
“ 兼 容 性 ?概念 .摩尔 定律 等 内 容 ,要 求学 生 能 够 掌握 和 理解 。 

计算 机 层次 化 概念 和 计算 机 系统 组 成 的 内 容 是 相互 联系 的 。 不 同 计算 机 用 户 眼中 的 计 
算 机 系统 是 不 一 样 的 ,可 以 从 最 终 用 户 感觉 到 的 计算 机 硬件 和 软件 的 形态 开始 ,逐步 深入 到 
系统 管理 员 、 应 用 程序 员 、 系 统 程序 员 , 以 及 系统 架构 师 眼中 的 硬件 和 软件 形态 。 这 两 部 分 
内 容 对 学 生 建 立 整 个 计算 机 系统 全 貌 以 及 了 解 本 课程 在 计算 机 系统 中 的 位 置 是 非常 重 
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要 的 。 

为 了 让 学 生 能 够 深入 理解 高 级 语言 源 程序 和 机 器 语言 目标 代码 之 间 的 关系 ,建议 让 学 
生 做 一 些 编程 实验 ,例如 ,可 以 让 学 生 对 主教 材 ?1. 3. 5 节 给 出 的 hello. e 源 程序 进行 编译 、 
链接 ,最 终生 成 可 执行 目标 代码 ,并 要 求学 生 比 较 源 程序 和 目标 代码 , 找 出 对 应 关系 ,并 找到 
函数 printf O 〇 对 应 的 机 器 代码 段 等 。 


1.2 主要 内 容 提 要 


1,， 冯 ，。 诺 依 曼 计算 机 结构 的 主要 特点 

冯 ， 诺 依 曼 计算 机 结构 的 主要 特点 包括 : 计算 机 由 运算 器 、 控 制 器 存储 器 、 输 入 设 
备 和 输出 设备 5 大 部 分 组 成 。@ 指 令 和 数据 用 二 进 制 表 示 ,两 者 形式 上 没有 差别 。 回 指令 
和 数据 存放 在 存储 器 中 , 按 地 址 访问 。 图 指令 由 操作 码 和 地 址 码 组 成 ,操作 码 指定 操作 人 性 
质 , 地 址 码 指 定 操作 数 地 址 。@ 采 用 “存储 程序 ”方式 进行 工作 。 

2, 计算 机 硬件 的 基本 组 成 和 功能 

运算 器 用 来 进行 各 种 算术 逻辑 运算 ;控制 器 用 来 对 指令 译 码 并 送出 操作 控制 信号 ;存储 
器 用 来 存放 指令 和 数据 ;输入 和 输出 设备 用 来 实现 计算 机 和 用 户 之 间 的 信息 交换 。 

3, 计算 机 系统 的 层次 结构 

计算 机 系统 分 软件 和 硬件 两 部 分 ,软件 和 硬件 的 界面 是 指令 集体 系 结构 (ISA》。 计 算 
机 系统 从 高 到 低 粗 分 为 应 用 软件 、 系 统 软件 和 硬件 3 个 层次 ;不 同 计算 机 用 户 工作 在 不 同 的 
层次 ,从 高 到 低 细 分 为 应 用 程序 级 (最 终 用 户 )、 高 级 语言 虚拟 机 级 (高 级 语言 程序 员 或 应 用 
程序 员 ) 、 汇 编 语言 虚拟 机 级 (汇编 语言 程序 员 ) ,操作 系统 虚拟 机 级 (系统 管理 员 ) 、 机 器 语言 
机 器 级 (机 器 语言 程序 员 ) 。 

4. 硬件 和 软件 的 相互 关系 

计算 机 硬件 和 软件 两 者 相辅相成 , 缺 一 不 可 。 两 者 都 用 来 实现 逻辑 功能 ,同一 功能 可 用 
硬件 实现 ,也 可 用 软件 实现 。 

5. 程序 开发 和 执行 过 程 

首先 用 某 种 语言 (高 级 语言 或 低级 语言 ?编制 源 程序 ,然后 用 语言 处 理 程序 (编译 程序 或 
汇编 程序 ) 将 源 程 序 翻译 成 机 器 语言 目标 程序 。 通 过 某 种 方式 启动 目标 程序 (可 执行 代码 ) 
执行 时 ,操作 系统 将 指令 和 数据 装 人 内存 ,然后 从 第 一 条 指令 开始 执行 。 每 条 指令 的 执行 过 
程 为 取 指 令 、 指 令 译 码 、 取 操作 数 、 运 算 、 送 结果 、PC 指向 下 一 条 指令 。 可 执行 程序 由 若干 
指令 组 成 ,CPU 周而复始 地 执行 一 条 一 条 指令 ,直到 程序 所 含 指令 全 部 执行 完 。 

6, 基本 性 能 指标 和 性 能 参数 

计算 机 系统 的 基本 性 能 指标 包括 响应 时 间 和 吞吐 率 。 处 理 器 的 基本 性 能 参数 包括 时 钟 
周期 (或 主 频 )、CPI、.MIPS、MFLOPS( 或 GFLOPS、TFLOPS、PFLOPS 等 ) 。 

7, 性 能 的 测量 

一 般 把 程序 的 响应 时 间 划 分 成 CPU 时 间 和 等 待 时 间 ,CPU 时 间 又 分 成 用 户 CPU 时 间 
和 操作 系统 CPU 时 间 。 因 为 操作 系统 对 自身 所 用 的 时 间 进 行 测量 时 ,不 十 分 准确 ,所 以 ， 
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对 CPU 性 能 的 测量 一 般 是 通过 测量 程序 运行 时 的 用 户 CPU 时 间 来 进行 的 。 

8. 各 种 性 能 指标 之 间 的 关系 

时 钟 周期 和 时 钟 频率 互 为 倒数 。CPU 执行 时 间 可 用 “CPU 时 钟 周期 数 X 时 钟 周期 ?来 
计算 。CPU 时 钟 周期 数 可 用 “程序 所 含 指令 条 数 X 程 序 的 CPI” 来 计算 。 

9， 和 性 能 评价 程序 

可 采用 一 组 性 能 评价 程序 ( 即 基准 程序 ) 对 机 器 性 能 进行 评测 。 有 些 机 器 制造 商会 针对 
基准 程序 中 频繁 出 现 的 语句 采用 专门 的 编译 器 进行 优化 ,使 基准 程序 的 运行 效率 大 幅 提 高 ， 
因此 有 时 用 基准 程序 得 到 的 评测 结果 不 能 说 明 问 题 。 


1.3 基本 术语 解释 


系列 机 (Family Machine) 

系列 机 是 指 一 个 厂家 生产 的 具有 相同 系统 结构 、 不 同 组 成 和 实现 的 一 系列 不 同型 号 的 
机 器 。 它 应 在 指令 系统 、 数 据 格式 、 字 符 编码 、 中 断 系统 、 控 制 方式 、 输 入 /输出 控制 方式 等 方 
面 保持 统一 ,从 而 保证 软件 的 兼容 性 。 

兼容 性 (Compatibility) 

兼容 是 一 个 广泛 的 概念 ,主要 表示 一 种 “ 互 换 ? 特 性 ,包括 软件 兼容 、 硬 件 兼容 等 。 

软件 兼容 (Software Compatibility) 

指 在 某 档 机 型 上 开发 的 软件 可 以 不 加 修改 地 在 另外 的 机 型 上 正确 运行 。 一 般 在 同一 系 
列 机 型 内 的 软件 是 兼容 的 ,有 向 上 兼容 和 向 下 兼容 两 种 形式 。 向 上 兼容 是 指 高 档 机 型 上 的 
程序 能 在 低档 机 型 上 运行 ,向 下 兼容 是 指 低档 机 型 上 的 程序 能 在 高 档 机 型 上 运行 。 一 般 系 
列 机 满足 向 下 兼容 性 ,因为 系列 机 中 高 档 机 的 指令 系统 包含 了 低档 机 中 的 所 有 指令 。 

硬件 兼容 (Hardware Compatibility》 

也 就 是 设备 或 部 件 兼容 ,是 指 设备 或 部 件 可 以 不 加 改动 地 用 于 多 种 计算 机 。 这 要 求 设 
备 或 部 件 符合 某 种 标准 化 设计 。 

小 规模 集成 电路 (Small Scale Integrated Circuits,SSI) 

集成 度 小 于 100 的 集成 电路 。 

中 规模 集成 电路 (Medium Scale Integrated Circuits, MSD 

集成 度 在 100 到 1000 的 集成 电路 。 

大 规模 集成 电路 (Large Scale Integrated Circuits ,LSID) 

集成 度 在 1000 到 10 万 的 集成 电路 。 

超大 规模 集成 电路 (Very Large Scale Integrated Circuits,VLSI) 

集成 度 在 10 万 到 1000 万 的 集成 电路 。 

极 大 规模 集成 电路 (Ultra Large Scale Integrated Circuits, ULSI) 

集成 度 在 1000 万 以 上 的 集成 电路 。 

摩尔 定律 (Moore”s Law) 

1965 年 摩尔 预测 :“ 以 后 每 年 将 缩小 硅 片 中 形成 晶体 管 电路 的 细 线 尺寸 的 10%, 芯 片 
制造 商 能 够 每 3 年 发 布 新 一 代 的 芯片 ,其 晶体 管 数 为 上 一 代 的 4 倍 ”。 后 来 摩尔 定律 被 表述 
成 :“ 由 于 集成 电路 技术 的 不 断 改进 ,每 18 一 24 个 月 ,集成 电路 芯片 上 集成 的 晶体 管 数 将 翻 
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一 番 , 速 度 将 提高 一 倍 , 而 价格 将 降低 一 半 ”。 

通用 电子 计算 机 (General-purpose Electronic Computer) 

通用 电子 计算 机 是 和 专用 电子 计算 机 对 应 的 ,专用 机 只 能 专门 用 于 某 种 应 用 ,而 通用 电 
子 计算 机 ,从 定义 上 来 说 , 它 可 以 解决 任何 问题 ,只 要 这 个 问题 可 以 用 程序 来 表示 。 通 用 电 
子 计算 机 也 被 称 为 完备 的 图 灵机 。 

算术 逻辑 单元 (Arithmetic Logic Unit, ALU) 

对 数据 进行 算术 运算 和 逻辑 运算 处 理 的 部 件 。 

数据 通路 (Datapath) 

数据 通路 是 指 指令 在 执行 过 程 中 数据 所 经 过 的 部 件 以 及 部 件 之 间 的 连接 线路 ,主要 由 
ALU 和 一 组 寄存 器 存储器. 总线 等 组 成 。 国 内 许多 教科 书 中 提 到 的 运算 器 即 运 算数 据 
通路 。 

控制 器 (Control Unit) 

也 称 为 控制 单元 或 控制 部 件 。 其 作用 是 对 指令 进行 译 码 , 将 译 码 结果 和 状态 /标志 信 
号 、 时 序 信号 等 进行 组 合 ,产生 各 种 操作 控制 信号 。 这 些 操 作 控制 信号 被 送 到 CPU 内 部 或 
通过 总 线 送 到 主 存 或 1/O 模块 。 送 到 CPU 内 部 的 控制 信号 用 于 控制 CPU 内 部 数据 通路 
的 执行 , 送 到 主 存 或 IO 模块 的 信号 控制 CPU 和 主 存 或 CPU 和 I/O 模块 之 间 的 信息 交 
换 。 控 制 单元 是 整个 CPU 的 指挥 控制 中 心 ,通过 规定 各 部 件 在 何 时 做 什么 动作 来 控制 数 
据 的 流动 ,完成 指令 的 执行 。 

中 央 处 理 器 (Central Processing Unit,CPU ) 

中 央 处 理 器 是 计算 机 中 最 重要 的 部 分 之 一 ,主要 由 运算 器 和 控制 器 组 成 。 其 内 部 结构 
归纳 起 来 可 以 分 为 控制 部 件 、 运 算 部 件 和 存储 部 件 3 大 部 分 ,它们 相互 协调 ,共同 完成 对 指 
令 的 执行 。 

存储 器 (Memory, Storage) 

存储 器 用 于 存储 程序 和 数据 ,分 为 内 存储 器 (Memory) 和 外 存储 器 (Storage) 。 内 存 存 
取 速 度 快 、 容 量 小 、 价 格 贵 ;外 存 容 量 大 、 价 格 低 , 但 存 取 速 度 慢 。 

内 存 (Memory) 

从 字面 上 来 说 ,内 存 是 内 部 存储 器 ,应 该 包括 主 存 (Main Memory, MM) 和 高 速 缓存 
(cache) ,但 是 ,因为 早期 计算 机 中 没有 高 速 缓存 ,因而 传统 意义 上 内 存 就 是 主 存 , 所 以 ,目前 
也 并 不 区 分 内 存 和 主 存 。 内 存 位 于 CPU 之 外 ,用 来 存放 已 被 启动 执行 的 程序 及 所 用 数据 ， 
包括 ROM 芯片 和 RAM 芯片 组 成 的 相应 ROM 存储 区 和 RAM 存储 区 两 部 分 。 

外 存 (Storage) 

外 存储 器 主要 有 磁盘 存储 器 、 磁 带 存 储 器 和 光盘 存储 器 等 。 磁 盘 是 最 常用 的 外 存储 器 ， 
通常 它 分 为 软盘 和 硬盘 两 类 。 容 量 极 大 、 价 格 便宜 的 磁带 机 和 光盘 组 等 称 为 海量 存储 器 , 常 
用 作 数 据 备 份 , 也 称 为 辅 存 (Accessorial Memory，AM ) 或 二 级 存储 器 (Secondary 
Memory) 。 

系统 软件 (System Software) 

系统 软件 是 介 于 计算 机 硬件 与 应 用 程序 之 间 的 各 种 软件 , 它 与 具体 应 用 关系 不 大 。 系 
统 软件 包括 操作 系统 (如 Windows) 、 语 言 处 理 系统 (如 C 语言 编译 器 ) .数据库 管理 系统 (如 
Oracle) 和 各 类 实用 程序 (如 磁盘 碎片 整理 程序 、 备 份 程序 》。 
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应 用 软件 (Application Software) 

应 用 软件 是 指 为 针对 使 用 者 的 某 种 应 用 目的 所 编写 的 软件 ,例如 ,办 公 自 动 化 软件 , 互 
联网 应 用 软件 ,多 媒体 处 理 软 件 , 股 票 分 析 软 件 , 游 戏 软件 ,管理 信息 系统 等 。 

操作 系统 (Operating System) 

操作 系统 简称 OS, 是 计算 机 系统 中 负责 支撑 应 用 程序 运行 环境 以 及 用 户 操 作 环 境 的 系 
统 软件 ,其 目的 是 使 计算 机 系统 所 有 资源 最 大 限度 地 发 挥 作用 ,并 为 用 户 提供 方便 有效 、 友 
善 的 服务 界面 。 操 作 系 统 是 一 个 庞大 的 管理 控制 程序 ,大 致 包括 5 个 方面 的 管理 功能 : 进 
程 与 处 理 机 管理 ,作业 管理 .存储 管理 设备 管理 和 文件 管理 。 目 前 比较 流行 的 操作 系统 主 
要 有 两 个 家 族 : 类 Unix 家 族 和 微软 的 Windows 家 族 。 

最 终 用 户 (End User) 

使 用 应 用 软件 完成 特定 任务 的 计算 机 用 户 称 为 最 终 用 户 。 大 多 数 计算 机 使 用 者 都 属于 
最 终 用 户 。 例 如 ,使 用 炒股 软件 的 股民 、 玩 计算 机 游戏 的 人 、 进 行 会 计 电 算 化 处 理 的 财会 人 
员 等 。 

系统 管理 员 (System Administrator) 
利用 操作 系统 提供 的 功能 对 系统 进行 配置 .管理 和 维护 以 建立 高 效 合理 的 系统 环境 供 
计算 机 用 户 使 用 的 操作 人 员 。 其 职责 主要 包括 安装 、 配 置 和 维护 系统 的 硬件 和 软件 ,建立 和 
管理 用 户 账户 ,升级 软件 ,备份 和 恢复 业务 系统 及 数据 等 。 

应 用 程序 员 (Application Programmer) 

使 用 高 级 编程 语言 编制 应 用 软件 的 程序 员 。 

系统 程序 员 (System Programmer) 

设计 和 开发 系统 软件 的 程序 员 , 如 开发 操作 系统 、 编 译 器 数据库 管理 系统 等 系统 软件 
的 程序 员 。 

高 级 语言 (High-level Programming Language ) 

也 称 高 级 编程 语言 或 算法 语言 。 它 是 面向 问题 和 算法 的 描述 语言 。 用 这 种 语言 编写 程 
序 时 ,程序 员 不 必 了 解 实际 机 器 的 结构 和 指令 系统 等 细节 ,而 通过 一 种 比较 自然 的 \ 直 接 的 
方式 来 描述 问题 和 算法 。 

汇编 语言 (Assembly Language) 

汇编 语言 是 一 种 面向 实际 机 器 结构 的 低级 语言 ,是 机 器 语言 的 符号 表示 ,与 机 器 语言 一 
一 对 应 。 因 此 ,汇编 语言 程序 员 必 须 对 机 器 的 结构 和 指令 系统 等 细节 非常 清楚 。 

机 器 语言 (Machine Language) 

机 器 语言 是 指 直接 用 二 进 制 代码 (指令 ?表示 的 语言 。 用 户 必须 用 二 进 制 代码 来 编写 机 
器 语言 程序 。 因 此 ,机 器 语言 程序 员 必 须 对 机 器 的 结构 和 指令 系统 等 细节 非常 清楚 。 

指令 集 (Instruction Set) 

一 台 计 算 机 能 够 执行 的 所 有 机 器 指令 的 集合 。 按 功能 指令 可 以 分 为 运算 指令 、 移 位 指 
令 、 传 送 指令 、 串 指令 程序 控 制 指令 等 类 型 。 

指令 集体 系 结构 (Instruction Set Architecture,ISA) 

是 计算 机 硬件 与 系统 软件 之 间 的 接口 , 指 机 器 语言 程序 员 或 操作 系统 、 编 译 器 、 解 释 器 
设计 人 员 所 看 到 的 计算 机 功能 特性 和 概念 性 结构 。 其 核心 部 分 是 指令 系统 ,同时 还 包含 数 
据 类 型 和 数据 格式 定义 .寄存 器 设计 、.I/O 空间 的 编 址 和 数据 传输 方式 .中 断 结构 、 计 算 机 状 
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态 的 定义 和 切换 存储 保护 等 。ISA 设计 的 好 坏 直接 决定 了 计算 机 的 性 能 和 成 本 。 

透明 性 (Transparency) 

由 于 计算 机 系统 采用 了 层次 化 结构 进行 设计 和 组 织 , 因 而 面向 不 同 的 硬件 或 软件 层面 
进行 工作 的 人 员 或 用 户 所 “看 到 ”的 计算 机 是 不 一 样 的 。 也 就 是 说 ,计算 机 组 织 方式 或 系统 
结构 中 的 一 部 分 对 某 些 用 户 而 言 是 “看 不 到 ”的 或 称 为 “< 透明” 的。 例如 ,对 于 高 级 语言 程序 
员 来 说 ,指令 格式 、 数 据 格式 、 机 器 结构 、 指 令 和 数据 的 存 取 方 式 等 ,都 是 透明 的 ;而 对 于 机 器 
语言 程序 员 和 汇编 语言 程序 员 来 说 ,指令 格式 、 机 器 结构 、 数 据 格 式 等 则 不 是 透明 的 。 

源 程序 (Source Program) 

编译 程序 解释 程序 和 汇编 程序 统称 为 语言 处 理 程序 。 各 种 语言 处 理 程 序 处 理 的 对 象 
称 为 源 程序 ,用 高 级 (算法 ) 语 言 或 汇编 语言 编写 。 如 C 语言 源 程序 、Java 语言 源 程序 、 汇 编 
语言 源 程 序 等 。 

目标 程序 (Object Program) 

编译 程序 和 汇编 程序 对 源 程 序 进 行 翻 译 得 到 的 结果 程序 称 为 目标 程序 或 目标 代码 
(Object Code) 。 

编译 程序 (Compiler) 

也 称 编译 器 ,用 来 将 高 级 语言 源 程序 翻译 成 汇编 语言 或 机 器 语言 目标 代码 的 程序 。 

解释 程序 (Interpreter) 

解释 程序 将 源 程 序 的 一 条 语句 翻译 成 对 应 的 机 器 语言 目标 代码 ,并 立即 执行 ,然后 翻译 
下 一 条 源 程序 语句 并 执行 ,直到 所 有 源 程序 中 的 语句 全 部 被 翻译 并 执行 完 。 因 此 ,解释 程序 
并 不 输出 目标 程序 ,而 是 直接 输出 源 程 序 的 执行 结果 。 

汇编 程序 (Assembler) 

汇编 程序 也 是 一 种 语言 翻译 程序 , 它 把 汇编 语言 写 的 源 程序 翻译 为 机 器 语言 目标 程序 。 
汇编 程序 和 汇编 语言 是 两 个 不 同 的 概念 ,不 能 混为一谈 。 

响应 时 间 (Response Time) 

也 称 执行 时 间 (Execution Time) 或 延迟 时 间 (Latency) ,是 指 从 作业 提交 开始 到 作业 完 
成 的 时 间 。 一 般 一 个 程序 的 响应 时 间 除 了 CPU 执行 程序 包含 的 指令 执行 时 间 外 ,还 包括 
等 待 IO 的 时 间 , 系 统 运 行 其 他 用 户 程序 所 用 的 时 间 , 以 及 操作 系统 运行 的 时 间 等 。 

吞吐 率 (Throughput) 

在 有 些 场 合 下 ,吞吐 率 也 称 带宽 (Bandwidth) ,是 指 在 一 定 的 时 间 内 所 完成 的 工作 量 。 

CPU 执行 时 间 (CPU Execution Time) 

也 称 CPU 时 间 , 指 在 程序 运行 过 程 中 ,CPU 真正 用 于 程序 执行 的 时 间 。 它 不 包括 因为 
等 待 /O 操作 完成 所 需要 的 时 间 , 也 不 包括 CPU 执行 其 他 程序 所 需要 的 时 间 。 对 用 户 来 
说 ,能 直接 感觉 到 的 只 能 是 响应 时 间 , 而 不 可 能 是 CPU 执行 时 间 。 它 被 进一步 分 为 两 部 
分 : 一 部 分 是 用 来 运行 用 户 程 序 代码 的 时 间 , 称 为 用 户 CPU 时 间 (User CPU Time); 另 一 
部 分 是 为 了 执行 用 户 程 序 而 运行 一 些 操作 系统 代码 所 花费 的 时 间 , 称 为 系统 CPU 时 间 
(System CPU Time) 。 

系统 性 能 (System Performance) 

通常 用 在 没有 其 他 任何 负载 的 情况 下 程序 的 响应 时 间 来 表示 系统 性 能 。 

CPU 性 能 (CPU Performance) 
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通常 用 用 户 CPU 时 间 来 表示 CPU 性 能 。 

时 钟 周期 (Clock Cycle, Tick, Clock Tick,Clock)》 

所 有 计算 机 执行 指令 的 过 程 都 是 分 成 若干 步骤 和 相应 的 动作 来 完成 的 ,每 一 步 动作 都 
可 能 有 相应 的 控制 信号 进行 控制 ,这 些 控 制 信号 何 时 发 出 、 作 用 时 间 多 长 ,都 要 有 相应 的 定 
时 信号 进行 同步 。 因 此 ,CPU 必须 能 够 产生 用 于 同步 的 时 钟 定时 信号 ,也 就 是 CPU 的 主 脉 
冲 信号 ,其 宽度 称 为 时 钟 周期 。 

时 钟 频率 (Clock Rate, 主 频 》 

CPU 的 主 频 就 是 CPU 中 的 主 脉 冲 时 钟 信 号 的 频率 ,是 CPU 时 钟 周期 的 倒数 。 

CPI(Cycle Per Instruction) 

衡量 CPU 性 能 的 一 种 计量 单位 。 表 示 执 行 一 条 指令 所 需要 的 平均 时 钟 周期 个 数 。 

基准 测试 程序 (Benchmark) 

是 专门 用 来 进行 性 能 评价 的 一 组 程序 ,这 些 程序 能 够 很 好 地 反映 机 器 在 运行 实际 负载 
时 的 性 能 。 可 以 在 不 同 机 器 上 运行 相同 的 基准 测试 程序 来 比较 不 同 机 器 的 运行 时 间 , 从 而 
比较 其 性 能 。 

SPEC 基准 测试 程序 集 (SPEC Benchmark) 

系统 性 能 评价 标准 SPEC(System Performance Evaluation Cooperative) 是 一 个 应 用 最 
广泛 ,也 是 最 全 面 地 对 CPU 人 性 能 进行 评测 的 基准 程序 集 。 分 整数 程序 集 SPECint 和 学 点 
程序 集 SPECfp。 

SPEC 比值 (SPEC Ratio) 

将 测试 程序 在 Sun SPARCstation 上 运行 时 的 执行 时 间 除 以 该 程序 在 测试 机 器 上 的 执 
行 时 间 所 得 到 的 比值 。 比 值 越 大 ,机 器 的 性 能 越 好 。 

阿 姆 代 尔 定律 (Amdahls Law) 

主要 含义 是 指 系 统 优化 某 部 件 所 获得 的 系统 性 能 的 改善 程度 ,取决 于 该 部 件 被 使 用 的 
频率 ,或 所 占 总 执行 时 间 的 比例 。 该 定律 很 好 地 刻画 了 改善 “系统 瓶颈 ?性 能 的 重要 性 。 

MIPS (Million Instructions Per Second) 

用 来 衡量 单位 时 间 内 执行 指令 的 条 数 , 具 体 是 指 每 秒 钟 执行 多 少 百 万 条 指令 。 

加 法 指令 执行 速度 (Add Instruction Execution Speed) 

最 早 用 来 衡量 计算 机 性 能 的 指标 是 完成 单个 运算 (如 加 法 运算 ) 指 令 所 需要 的 时 间 。 当 
时 大 多 数 指令 的 执行 时 间 是 相同 的 。 加 法 指令 能 反映 乘 、 除 等 运算 ,而 其 他 指令 的 时 间 也 大 
体 与 加 法 指令 相当 。 故 加 法 指令 的 速度 有 一 定 的 代表 性 。 计 量 单位 为 KIPS( 每 秒 千 条 指 
令 ) 和 MIPS (每 秒 百 万 条 指令 )。 

平均 指令 执行 时 间 (Average Instruction Execution Time) 

也 称 等 效 指令 速度 法 或 Gibson 混合 法 。 随 着 计算 机 的 发 展 ,不 同 指 令 所 需要 的 执行 时 
间 差 别 越 来 越 大 ,人 们 就 根据 等 效 指令 速度 法 通过 统计 各 类 指令 在 程序 中 所 占 比 例 进 行 折 
算 。 设 某 类 指令 i 在 程序 中 所 占 比例 为 w;, 执 行 时 间 为 , 则 等 效 指令 的 执行 时 间 为 二 
Wi XH 十 Ws Xt 十 … 十 w Xi(n 为 指令 种 类 数 )。 如 果 指 令 执行 时 间 用 时 钟 周期 数 来 衡量 ， 
平均 指令 执行 时 间 就 是 平均 CPI。 对 平均 指令 执行 时 间 求 倒数 能 够 得 到 平均 MIPS。 

峰值 MIPSCPeak MIPS) 

选取 一 组 指令 组 合 , 使 得 平均 CPI 最 小 ,由 此 得 到 的 MIPS 就 是 峰值 MIPS。 有 些 制造 
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| 商 经 常 将 峰值 MIPS 直接 当 作 MIPS, 因 此 ,实际 上 的 性 能 要 比 标 称 的 性 能 差 。 
| 相对 MIPSCRelative MIPS) 

根据 一 种 公认 的 参考 机 型 来 定义 相应 的 MIPS 值 ,其 值 的 含义 是 相对 于 参考 机 型 
MIPS 的 多 少 倍 。 

MFLOPS(Million Floating-point Operations Per Second) 

是 计算 机 浮 点 运算 速度 的 一 种 计量 单位 。 表 示 每 秒 钟 执行 多 少 百 万 次 浮 点 操作 。 它 是 
基于 所 完成 的 单 精度 浮 点 数 的 操作 次 数 而 不 是 指令 数 来 衡量 的 。 


1.4 常见 问题 解答 


1. 计算 机 系统 就 是 硬件 系统 吗 ? 

答 : 说 计算 机 系统 就 是 硬件 系统 是 不 完整 的 。 一 个 完整 的 计算 机 系统 应 该 包括 硬件 系 
统 和 软件 系统 两 部 分 。 硬 件 系统 包括 运算 器 、 控 制 器 存储器、 输入 设备 和 输出 设备 五 大 基 
本 部 件 。 软 件 系统 分 为 系统 软件 和 应 用 软件 两 大 类 。 系 统 软件 包括 操作 系统 、 计 算 机 语言 
处 理 程序 (各 种 程序 翻译 软件 ,包括 编译 程序 解释 程序 、 汇 编程 序 ) 、 服 务 性 程序 、 数 据 库 管 
理 系统 和 网 络 软件 等 ;应 用 软件 包括 各 种 特定 领域 的 处 理 程序 。 计 算 机 系统 中 的 硬件 和 软 
件 是 相辅相成 的 , 缺 一 不 可 。 软 件 是 计算 机 系统 的 灵魂 ,没有 软件 的 硬件 不 能 被 用 户 使 用 。 

2， 同 一 个 功能 可 以 由 软件 完成 也 可 以 由 硬件 完成 吗 ? 

答 : 软件 和 硬件 是 两 种 完全 不 同 的 形态 ,硬件 是 实体 ,是 物质 基础 ;软件 是 一 种 信息 ,看 
不 见 , 摸 不 到 。 但 是 它们 都 可 以 用 来 实现 逻辑 功能 ,所 以 在 逻辑 功能 上 ,软件 和 硬件 是 等 价 
的 。 因 此 ,在 计算 机 系统 中 ,许多 功能 既 可 以 直接 由 硬件 实现 ,也 可 以 在 硬件 的 配合 下 由 软 
件 来 实现 。 例 如 : 乘法 运算 既 可 以 用 专门 的 乘法 器 硬件 实现 , 即 机 器 提供 专门 的 一 条 乘法 
指令 ;也 可 以 用 乘法 子 程序 来 实现 , 即 不 提供 乘法 指令 ,而 由 加 法 指令 和 移 位 指令 等 组 成 的 
一 个 指令 序列 来 完成 乘法 运算 。 

3. 解释 程序 和 编译 程序 有 什么 差别 ? 

答 : 编译 程序 和 解释 程序 是 两 种 不 同 的 翻译 程序 。 不 同 在 于 编译 程序 将 高 级 语言 源 程 
序 全 部 翻译 成 目标 程序 ,每 次 执行 程序 时 ,只 要 执行 目标 程序 ,因此 ,只 要 源 程 序 不 变 , 就 无 
须 重 新 翻译 ;解释 程序 是 将 源 程序 的 一 条 语句 ,翻译 成 对 应 的 机 器 目标 代码 并 立即 执行 , 然 
后 翻译 下 一 条 语句 并 执行 ,直到 所 有 源 程 序 中 的 语句 全 部 被 翻译 并 执行 完 。 所 以 解释 程序 
的 执行 过 程 是 翻译 一 名 ,执行 一 句 。 解 释 的 结果 是 源 程序 执行 的 结果 ,而 不 会 生成 目标 
程序 。 

4. 要 计算 机 做 的 任何 工作 都 要 先 编写 成 程序 才能 完成 玛 ? 

答 : 是 的 。 要 计算 机 完成 的 任何 事情 ,都 必须 先 编制 程序 ,程序 是 由 指令 构成 的 。 不 管 
是 用 哪 种 语言 编写 的 程序 ,最 终 都 要 翻译 成 机 器 语言 程序 才能 让 机 器 理解 。 机 器 语言 程序 
是 由 一 条 一 条 指令 组 成 的 程序 。CPU 的 主要 功能 就 是 周而复始 地 执行 指令 ,因此 ,要 计算 
机 完成 的 所 有 功能 都 是 通过 执行 一 条 一 条 指令 来 实现 的 ,也 就 是 由 一 个 程序 来 完成 的 。 有 
时 说 某 个 特定 的 功能 是 由 硬件 实现 的 ,并 不 是 说 不 要 编写 程序 ,如 乘法 功能 可 由 乘法 器 这 个 
硬件 实现 ,但 要 启动 这 个 硬件 (乘法 器 ) 工 作 ,必须 先 执行 程序 中 的 乘法 指令 。 
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5， 指 令 和 数据 在 形式 上 没有 差别 , 且 都 存 于 存储 器 中 ,计算 机 如 何 区 分 它们 呢 ? 

答 : 指令 和 数据 在 计算 机 内 部 都 是 用 二 进 制 表示 的 ,因而 都 是 0、1 序列 ,在 形式 上 没有 
差别 。 在 指令 和 数据 取 人 到 CPU 之 前 ,它们 都 存放 在 存储 器 中 ,CPU 必须 能 够 区 分 读 出 的 
是 指令 还 是 数据 。 如 果 是 指令 ,CPU 会 把 指令 的 操作 码 送 到 指令 译 码 器 进行 译 码 ,而 把 指 
令 的 地 址 码 送 到 相应 的 地 方 进 行 处 理 ; 如 果 是 数据 , 则 送 到 寄存 器 或 运算 器 。 那 么 ,CPU 如 
何 识别 读 出 的 是 指令 还 是 数据 呢 ? 实际 上 ,CPU 并 不 是 把 信息 从 主 存 读 出 后 , 靠 某 种 判断 
方法 来 识别 信息 是 数据 还 是 指令 的 ,而 是 在 读 出 之 前 就 知道 将 要 读 的 信息 是 数据 还 是 指令 
了 。 执 行 指令 的 过 程 分 为 取 指 令 ,指令 译 码 、 取 操作 数 、 运 算 、 送 结果 等 。 所 以 ,在 取 指 令 阶 
段 ,总 是 将 程序 计数 器 PC 的 内 容 作为 地 址 去 取 指令 ,所 以 取 来 的 一 定 是 指令 ; 取 操 作 数 阶 
段 取 来 的 一 定 是 数据 。 

6. 衡量 计算 机 系统 性 能 的 主要 指标 是 什么 ? 

答 : 计算 机 性 能 的 好 坏 主要 体现 在 速度 的 快慢 , 而 衡量 速度 快慢 主要 有 两 个 指标 : 响 
应 时 间 和 吞吐 率 。 响 应 时 间 是 指 从 作业 提交 开始 到 作业 完成 所 花 的 时 间 。 一 般 一 个 程序 的 
响应 时 间 除 了 CPU 执行 该 程序 包含 的 指令 所 用 的 时 间 外 ,还 包括 等 待 输入 输出 操作 所 需 
时 间 和 操作 系统 运行 该 程序 所 花 的 时 间 开 销 等 。 吞 吐 率 是 指 单位 时 间 内 完成 的 工作 量 。 

7. CPU 的 时 钟 频 率 越 高 ,机 器 的 速度 就 越 快 ,对 吗 ? 

答 : 在 其 他 因素 不 变 的 情况 下 ,CPU 的 时 钟 频率 越 高 ,机 器 的 速度 肯定 越 快 。 但 是 , 程 
序 执行 的 速度 除了 与 CPU 的 速度 有 关外 ,还 与 存储 器 和 I/O 模块 的 存 取 速度 、 总 线 的 传输 
速度 、cache 的 设计 策略 等 都 有 很 大 关系 。 因 此 ,机 器 的 速度 不 是 只 由 CPU 的 时 钟 频率 决 
定 的 。 

8，CPI 的 含义 是 什么 ? 执行 时 间 ( 响 应 时 间 ) 与 CPI 是 什么 关系 ? 

答 : CPI 是 指 每 条 指令 执行 所 用 的 时 钟 周 期 数 。 通 常 , 一 条 特定 指令 的 CPI 是 一 个 
确定 的 值 ,而 某 个 程序 的 CPI 则 是 一 个 平均 值 。 一 个 程序 的 执行 时 间 取 决 于 该 程序 所 包 
含 的 指令 数 .CPI 和 时 钟 周期 。 在 指令 条 数 和 时 钟 周期 一 定 的 情况 下 ,CPI 越 大 ,执行 时 
间 越 长 。 

9. 用户 真正 感觉 到 的 程序 执行 时 间 是 否 就 是 执行 一 个 程序 中 所 有 指令 所 用 的 时 间 ? 

答 : 不 是 。 执 行 一 个 程序 中 所 有 指令 所 用 的 时 间 实 际 上 比 用 户 真 正 感觉 到 的 程序 执行 
时 间 要 短 。 因 为 在 一 个 程序 执行 过 程 中 ,可 能 还 会 执行 操作 系统 代码 或 其 他 用 户 程 序 , 并 
且 , 有 时 还 可 能 等 待 1/O 操作 。 例 如 ,在 UNIX 操作 系统 中 ,假定 用 time 命令 测试 某 程序 执 
行 时 间 的 结果 为 “80. 3u 10. 1s 2: 02 74%”, 则 说 明 该 程序 所 有 指令 的 执行 时 间 ( 即 用 户 
CPU 时 间 ) 只 有 80. 3 秒 , 执 行 操作 系统 代码 所 用 时 间 ( 即 系统 CPU 时 间 ) 是 10. 1 秒 , 用 户 
感觉 到 的 总 响应 时 间 为 2X60 十 2 一 122 秒 , 其 中 的 (80. 3 十 10. 1)/122 一 74% 是 CPU 时 间 ， 
剩 下 26% 的 时 间 (30 多 秒 钟 ) 用 来 等 待 1/O 操作 或 运行 其 他 用 户 程 序 。 

10. 计算 机 的 MIPS 数 越 大 ,说 明 性 能 越 好 ,对 吗 ? 

答 : 不 对 。MIPS 数 反映 的 是 机 器 执行 定点 指令 的 速度 。 但 是 ,不 同 机 器 的 指令 集 不 
同 ,指令 的 功能 也 不 同 ,也 许 一 个 机 器 上 一 条 指令 的 功能 ,在 另外 一 个 机 器 上 要 用 多 条 指令 
来 完成 ,这 样 , 同 样 的 指令 条 数 所 完成 的 功能 可 能 完全 不 同 。 因 此 用 MIPS 数 来 对 不 同 的 机 
器 进行 性 能 比较 是 不 太 客观 的 。 


计划 规 组 成 与 系统 结 欧 习题 解答 与 才学 指导 


| 11， 基准 测试 程序 执行 得 越 快 ,说 明 机 器 的 性 能 越 好 ,对 玛 ? 

| 答 : 一 般 情况 下 ,基准 测试 程序 能 够 反映 机 器 性 能 的 好 坏 。 但 是 ,如 果 制 造 商 针 对 基准 
测试 程序 中 频繁 出 现 的 语句 采用 专门 的 编译 器 ,使 基准 程序 的 运行 效率 大 幅 提 高 ,那么 基准 
评测 程序 测试 的 结果 就 不 能 说 明 问 题 。 


1.5 单项 选择 题 


1. 以 下 有 关 对 摩尔 定律 的 描述 中 ,错误 的 是 (  )。 
A. 每 18 个 月 ,集成 电路 芯片 上 集成 的 晶体 管 数 将 翻 一 番 
B. 每 18 个 月 ,集成 电路 芯片 的 速度 将 提高 一 倍 
C. 每 18 个 月 ,集成 电路 芯片 的 价格 将 降低 一 半 
D. 集成 电路 技术 一 直 会 遵循 摩尔 定律 发 展 下 去 
2. 从 计算 机 的 主要 元 器 件 来 看 ,计算 机 发 展 所 经 历 的 过 程 为 ( )。 
A. 晶体 管 . 电 子 管 .SSI、MSI、LSI、ULSI、VLSI 
B. 电子 管 .晶体 管 .SSI、.MSI、LSI、VLSI、ULSI 
C. 电子 管 .晶体 管 .LSI、MSI、SSI、VLSI、ULSI 
D. 晶体 管 . 电 子 管 .MSI、SSI、LSI、ULSI、VLSI 
3. 一 个 完整 的 计算 机 系统 包括 硬件 和 软件 。 软 件 又 分 为 ( )。 
A. 操作 系统 和 语言 处 理 程序 
B. 系统 软件 和 应 用 软件 
C. 操作 系统 和 高 级 语言 
D. 低级 语言 程序 和 高 级 语言 程序 


4 以 下 给 出 的 软件 中 ,属于 应 用 软件 的 是 ( ) 。 

A. 汇编 程序 B. 编译 程序 

C. 操作 系统 D. 文字 处 理 程序 
5. 以 下 给 出 的 软件 中 ,属于 系统 软件 的 是 ( ) 。 

A. Windows XP B. MS Word 

C. 金山 词霸 D. RealPlayer 


6. 下 面 有 关 指 令 集体 系 结构 的 说 法 中 ,错误 的 是 (。 ”)。 
A. 指令 集体 系 结构 位 于 计算 机 软件 和 硬件 的 交界 面 上 
B. 指令 集体 系 结构 是 指 低级 语言 程序 员 所 看 到 的 概念 结构 和 功能 特性 
C. 程序 员 可 见 寄存 器 的 长 度 、 功 能 与 编号 不 属于 指令 集体 系 结构 的 内 容 
D. 指令 集体 系 结构 的 英文 缩写 是 ISA 

7. 计算 机 系统 采用 层次 化 结构 ,从 最 上 面 的 应 用 层 到 最 下 面 的 硬件 层 , 其 层次 化 构成 

为 ( )。 

A. 高 级 语言 虚拟 机 一 操作 系统 虚拟 机 一 汇编 语言 虚拟 机 一 机 器 语言 机 器 
B. 高 级 语言 虚拟 机 一 汇编 语言 虚拟 机 一 机 器 语言 机 器 一 操作 系统 虚拟 机 
C. 高 级 语言 虚拟 机 一 汇编 语言 虚拟 机 一 操作 系统 虚拟 机 一 机 器 语言 机 器 
D. 操作 系统 虚拟 机 一 高 级 语言 虚拟 机 一 汇编 语言 虚拟 机 一 机 器 语言 机 器 
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8. 以 下 有 关 程 序 编写 和 执行 方面 的 叙述 中 ,错误 的 是 ( “)。 
A. 可 用 高 级 语言 和 低级 语言 编写 出 功能 等 价 的 程序 
B. 高 级 语言 源 程序 和 汇编 语言 源 程序 都 不 能 在 机 器 上 直接 执行 
C. 编译 程序 员 必 须 了 解 机 器 结构 和 指令 系统 
D. 汇编 语言 是 一 种 与 机 器 结构 无 关 的 编程 语言 
9. 汉 。 诺 依 曼 计算 机 中 ,CPU 区 分 从 存储 器 取出 的 是 指令 还 是 数据 的 依据 是 ( ”)，。 
A， 指令 译 码 结果 的 不 同 
B. 访问 指令 和 访问 数据 时 寻 址 方式 不 同 
C. 访问 指令 和 访问 数据 时 所 处 的 指令 执行 阶段 不 同 
D. 指令 和 数据 所 在 的 存储 单元 地 址 范围 不 同 
10. 以 下 有 关 冯 “。 诺 依 曼 结构 计算 机 指令 和 数据 表示 的 叙述 中 ,正确 的 是 (  )。 
A. 指令 和 数据 可 以 从 形式 上 加 以 区 分 
B. 指令 以 二 进 制 形式 存放 ,数据 以 十 进 制 形式 存放 
C. 指令 和 数据 都 以 二 进 制 形式 存放 
D. 指令 和 数据 都 以 十 进 制 形式 存放 
11, 以 下 是 有 关 计 算 机 中 指令 和 数据 存放 位 置 的 叙述 ,其 中 正确 的 是 (  )。 
A. 指令 存放 在 内 存 ,数据 存放 在 外 存 
B， 指令 和 数据 任何 时 候 都 存放 在 内 存 
C. 指令 和 数据 任何 时 候 都 存放 在 外 存 
D, 程序 被 启动 后 ,其 指令 和 数据 才 被 装 人 内 存 
12. 汉 “， 诺 依 曼 计算 机 工作 方式 的 基本 特点 是 ( )。 
A. 程序 从 键盘 输入 的 同时 被 计算 机 执行 
B. 程序 直接 从 磁盘 被 读 到 CPU 执行 
C. 程序 中 的 指令 按 地 址 被 访问 并 自动 按 序 执行 
D. 程序 被 自动 执行 而 数据 通过 手工 输入 
13. 以 下 是 有 关 汉 “， 诺 依 曼 计算 机 结构 的 叙述 ,其 中 错误 的 是 (  )。 
A. 计算 机 由 运算 器 、 控 制 器 存储 器 和 输入 /输出 设备 组 成 
B. 程序 由 指令 和 数据 构成 ,存放 在 存储 器 中 
C. 指令 由 操作 码 和 地 址 码 两 部 分 组 成 
D. 指令 按 地 址 访问 ,所 有 数据 在 指令 中 直接 给 出 
14. 以 下 有 关 计 算 机 各 部 件 功能 的 叙述 中 ,错误 的 是 (  )。 
A. 运算 器 用 来 完成 算术 运算 
B. 存储 器 用 来 存放 指令 和 数据 
C. 控制 器 通过 执行 指令 来 控制 整个 机 器 的 运行 
D. 输入 /输出 设备 用 来 完成 用 户 和 计算 机 之 问 的 信息 交换 
15. 以 下 给 出 了 改善 计算 机 性 能 的 四 种 措施 : 
中 用 更 快 的 处 理 器 来 替换 原来 的 慢 速 处 理 器 
@ 增加 同类 处 理 器 个 数 ,使 得 不 同 的 处 理 器 同时 执行 不 同 的 程序 
@ 优化 编译 生成 的 代码 使 得 程序 执行 的 总 时 钟 周 期 数 减少 
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@ 减少 指令 执行 过 程 中 访问 内 存 的 时 间 
对 于 某 个 特定 的 程序 ,以 上 措施 中 ,能 缩短 其 执行 时 间 的 措施 是 (  )。 
A. DO.@ B. DO@O 
C. DO@ D. 全 部 
16. 若 某 典 型 基准 测试 程序 在 机 器 A 上 运行 时 需要 20s, 而 在 机 器 B 上 的 运行 时 间 是 
16s, 那 么 ,相对 来 说 ,下 面 给 出 的 结论 中 ,正确 的 是 (  )。 
A. 所 有 程序 在 机 器 A 上 都 比 在 机 器 B 上 运行 速度 慢 
B. 机 器 B 的 速度 是 机 器 A 的 1.25 倍 
C. 机 器 A 的 速度 是 机 器 B 的 1.25 售 
D. 机 器 A 比 机 器 B 人 慢 1.25 倍 
17. 已 知 计算 机 A 的 时 钟 频率 为 800MHz, 假 定 某 程 序 在 计算 机 A 上 运行 需要 12 秒 
钟 。 现 在 硬件 设计 人 员 想 设计 计算 机 B, 希 望 该 程序 在 B 上 的 运行 时 间 能 缩短 为 8 秒 钟 , 使 
用 新 技术 后 可 使 B 的 时 钟 频率 大 幅度 提高 ,但 在 B 上 运行 该 程序 所 需要 的 时 钟 周期 数 为 在 
A 上 的 1.5 倍 。 那 么 ,机 器 B 的 时 钟 频率 至 少 应 为 多 少 才能 达到 所 希望 的 要 求 ? (  ) 
A. 800MHz B. 1.2GHz C. 1.5GHz D. 1.8GHz 
18. 假设 同一 套 指 令 集 用 不 同 的 方法 设计 了 两 种 计算 机 A 和 B。 机 器 A 的 时 钟 周期 
为 1.2ns, 机 器 B 的 时 钟 周期 为 2ns。 某 个 程序 在 机 器 A 上 运行 时 的 CPI 为 2, 在 B 上 的 
CPI 为 1。 则 对 于 该 程序 来 说 ,机 器 A 和 机 器 B 之 间 的 速度 关系 为 ( ” )。 
A. 机 器 A 比 机 器 B 快 1.2 售 
B. 机 器 B 比 机 器 A 快 1.2 倍 
C. 机 器 A 的 速度 是 机 器 B 的 1.2 售 
D. 机 器 B 的 速度 是 机 器 A 的 1.2 倍 
19. 假定 编译 器 对 高 级 语言 的 某 条 语句 可 以 编译 生成 两 种 不 同 的 指令 序列 ,A、B 和 C 
三 类 指令 的 CPI 和 执行 两 种 不 同 序 列 所 含 的 三 类 指令 条 数 见 表 1. 1。 


表 1.1 各 类 指令 的 CPI 及 执行 的 指令 条 数 


序列 二 的 指令 条 数 


则 以 下 哪个 结论 是 错误 的 ? (  ) 
A. 序列 一 比 序列 二 少 1 条 指令 
B. 序列 一 比 序列 二 的 执行 速度 快 
C. 序列 一 的 总 时 钟 周期 数 比 序列 二 多 1 个 
D. 序列 一 的 CPI 比 序列 二 的 CPI 大 
20. 假定 用 不 同 的 编译 器 对 同一 个 程序 进行 编译 生成 不 同 的 目标 代码 指令 序列 ,A、B 
和 C 三 类 指令 的 CPI 和 执行 两 种 不 同 指令 序列 所 含 的 三 类 指令 条 数 见 表 1. 2。 
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表 1.2 各 类 指令 的 CPI 及 执行 的 指令 条 数 | 1 


序列 二 的 指令 条 数 
10X10? 


1X10? 


1X10? 


两 个 指令 序列 都 在 时 钟 周期 为 2ns 的 机 器 上 运行 。 根 据 计 算得 到 其 MIPS 指标 和 
执行 速度 两 方面 的 结论 为 ( )。 

A. 序列 一 的 MIPS 数 比 序列 二 多 50 ,序列 一 的 执行 速度 也 比 序列 二 快 10s 

B. 序列 二 的 MIPS 数 比 序列 一 多 50 ,但 序列 一 的 执行 速度 比 序列 二 快 10s 

C. 序列 一 的 MIPS 数 比 序列 一 多 100 ,序列 一 的 执行 速度 也 比 序列 二 快 20s 

D. 序列 二 的 MIPS 数 比 序列 一 多 100, 但 序列 一 的 执行 速度 比 序列 二 快 20s 


【参考 答案 】 

1.D 2.B 3.B 4.D 5. A 6.C 从 从 
8. D 9.C 10. C 11. D 12.C 13. D 14. A 
15. D 16. B 17. D 18. D 19. B 20. B 


1.6 分 析 应 用 题 


1. 请 说 明 以 下 措施 对 缩短 程序 的 响应 时 间 和 提高 系统 的 吞吐 率 各 有 什么 影响 ? 

(1) 使 用 更 快 的 处 理 器 。 

(2) 增加 处 理 器 个 数 ,使 得 不 同 的 处 理 器 同时 处 理 不 同 的 作业 。 

(3) 优化 编译 生成 的 代码 使 得 程序 执行 的 总 时 钟 周期 数 减少 。 

(4) 在 CPU 和 主 存 之 问 增加 cache, 减 少 CPU 访问 指令 和 数据 的 时 间 。 

【分 析 解 答 】 

措施 (1) : 因为 总 执行 时 间 王 总 时 钟 周期 数 X 时 钟 周期 。 更 快 的 处 理 器 意味 着 时 钟 频 
率 加 快 了 , 即 每 个 时 钟 周期 更 短 , 故 总 执行 时 间 变 短 了 。 因 此 采用 更 快 的 处 理 器 可 缩短 程序 
响应 时 间 , 从 而 使 单位 时 间 内 完成 的 作业 数 增加 ,系统 的 吞吐 率 也 提高 了 。 

措施 (2) : 处 理 器 个 数 的 增加 使 得 同时 可 以 有 多 个 作业 在 不 同 的 处 理 器 上 进行 处 理 , 因 
而 ,系统 在 单位 时 间 内 可 以 完成 更 多 的 作业 ,吞吐 率 会 明显 提高 。 但 每 个 作业 的 处 理 过 程 还 
是 一 样 的 ,所 以 程序 的 执行 时 间 并 不 会 缩短 。 但 是 ,因为 吞吐 率 提 高 了 ,所 以 作业 在 等 待 队 
列 中 的 排队 时 间 减 少 了 ,因而 响应 时 间 会 在 一 定 的 程度 上 有 相应 的 改善 。 

措施 (3) : 优化 编译 使 生成 的 代码 总 的 执行 时 钟 周期 数 减少 ,也 就 缩短 了 程序 的 执行 时 
间 , 因 而 使 得 单位 时 间 内 完成 的 作业 数 增加 ,系统 的 吞吐 率 也 提高 了 。 

措施 (4): 在 CPU 和 主 存 之 间 增 加 cache, 使 得 程序 访问 存储 器 的 时 间 大 大 缩短 , 因而 
可 以 缩短 程序 的 响应 时 间 , 从 而 也 就 使 得 单位 时 间 内 完成 的 作业 数 增加 ,并 提高 了 系统 的 吞 
吐 率 。 

综 上 所 述 ,措施 (1》、(3) 和 (4) 是 因为 首先 缩短 了 程序 的 执行 时 间 而 使 得 系统 吞吐 率 提 
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高 ;而 措施 (2) 是 因为 提高 了 系统 的 吞吐 率 ,使 得 程序 等 待 时间 缩 短 而 缩短 了 程序 响应 时 间 。 
程序 响应 时 间 和 系统 吞吐 率 之 间 通 常 是 相辅相成 的 关系 ,但 在 某 些 特定 情况 下 ,它们 有 可 能 
是 对 立 关系 。 

2. 假定 某 程序 P 个 100 条 指令 构成 的 循环 组 成 ,该 循环 共 执 行 50 次 ,在 某 系 统 S 
中 执行 程序 P 花 了 20000 个 时 钟 周期 , 则 系统 S 在 执行 程序 P 时 的 CPI 是 多 少 ? 

【分 析 解 答 】 

程序 P 中 100 条 指令 的 循环 被 执行 了 50 次 ,所 以 在 20000 个 时 钟 周 期 中 共 执 行 了 
5000 条 指令 ,所 以 ,系统 S 在 执行 程序 P 时 CPI 二 20000/5000==4。 

3. 假定 执行 某 种 指令 I 需要 20 个 时 钟 周期 ,该 指令 在 程序 中 的 出 现 频 度 为 10% ,其 他 
所 有 指令 的 平均 CPI 为 5, 则 CPU 执行 指令 I 所 用 时 间 占 整个 CPU 时 间 的 百分比 是 多 少 ? 
如 果 通 过 对 硬件 进行 改进 ,能 使 指令 I 的 执行 时 间 缩 短 为 10 个 时 钟 周期 ,但 同时 会 使 CPU 
时 钟 周期 延长 10% ,你 认为 是 否 应 该 采取 这 种 改进 措施 ? 

【分 析 解 答 】 

假定 CPU 执行 的 所 有 指令 条 数 为 N ,时钟 周 期 为 T, 则 CPU 执行 总 时 间 为 (20X10% 十 
5X90%)XNXT, 其 中 指令 I 所 用 时 间 为 20X10%XNXT, 因 此 ,CPU 执行 指令 I 所 用 时 
间 占 整个 CPU 时 间 的 百分比 是 20 X10% XNXT/((20X10% 十 5X90%)XNXT)= 
30.77%。 如 果 改 进 后 将 指令 工 的 执行 时 间 缩 短 为 10 个 时 钟 周期 ,时 钟 周期 的 长 度 延 长 
10%, 则 改进 后 CPU 执行 的 总 时 间 为 (10X10% 十 5X90%)XNX1.1XT=6.05XNXT， 
改进 前 的 总 时 间 为 (20X10% 十 5X90%)XNXT=6.5XNXT, 因 而 ,改进 后 的 性 能 是 改进 
前 的 6. 5/6.05=1.07 倍 。 由 此 可 见 , 对 硬件 的 这 种 改进 措施 能 够 提高 CPU 的 性 能 。 

4. 若 有 两 个 基准 测试 程序 Pl 和 P2 在 机 器 M1 和 M2 上 运行 ,假定 M1 和 M2 的 价格 
分 别 是 5000 元 和 8000 元 , 表 1.3 给 出 了 P1 和 了 P2 在 Ml 和 M2 上 所 用 的 时 间 和 指令 条 数 。 


表 1.3 P1 和 了 2 在 MI 和 M2 上 所 用 的 时 间 和 指令 条 数 


指令 条 数 执行 时 间 指令 条 数 


Pl 200X10° 1000ms 150X 10° 


执行 时 间 
500ms 


300X10 3ms 420X103 6ms 


请 回答 下 列 问题 : 

(1) 对 于 P1, 哪 台 机 器 的 速度 快 ? 快 多 少 ? 对 于 P2 呢 ? 

(2) 在 ML 上 执行 Pl 和 了 2 的 速度 分 别 是 多 少 MIPS? 在 M2 上 的 执行 速度 又 各 是 多 
少 ? 从 执行 速度 来 看 ,对 于 P2, 哪 台 机 器 的 速度 快 ? 快 多 少 ? 

(3) 假定 Ml 和 M2 的 时 钟 频率 各 是 800MHz 和 1. 2GHz, 则 在 Ml 和 M2 上 执行 P1 
时 的 平均 时 钟 周期 数 CPI 各 是 多 少 ? 


(4) 如 果 某 个 用 户 需 要 大 量 使 用 程序 P1, 并 且 该 用 户主 要 关心 系统 的 响应 时 间 而 不 是 
吞吐 率 , 那 么 ,该 用 户 需要 大 批 购 进 机 器 时 ,应 该 选择 M1 还 是 M2? 为 什么 ?〈 提 示 : 从 性 
价 比 上 考虑 ) 

《5) 如果 另 一 个 用 户 也 需要 购 进 大 批 机 器 ,但 该 用 户 使 用 Pl 和 了 2 一 样 多 ,主要 关心 的 
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也 是 响应 时 间 ,那么 ,应 该 选择 M1 还 是 M2? 为 什么 ? 

【分 析 解 答 】 

(1) 对 于 程序 P1, M1 所 花 的 执行 时 间 是 M2 的 2 倍 , 故 M2 比 M1 快 1 倍 ;对 于 程序 
P2,M2 所 花 的 执行 时 间 是 M1 的 2 倍 , 故 Ml 比 M2 快 1 倍 。 

(2) M1 中 P1 速度 为 200M/1s 一 200MIPS,P2 速度 为 300k/0. 003s 王 100MIPS; M2 中 
P1 速度 为 150M/0. 5s 二 300MIPS,P2 速度 为 420k/0. 006s 二 70MIPS。 从 执行 速度 来 看 ,对 
于 P2, 因 为 100/70==1.43, 所 以 M1 比 M2 快 0.43 倍 。 

(3) 在 ML 上 执行 Pl 时 的 平均 时 钟 周期 数 CPI 为 1sX800MHz/200M 一 4; 在 M2 上 执 
行 Pl 时 的 平均 时 钟 周期 数 CPI 为 0.5sX1.2GHz/150M 一 4。 

(4) 因为 该 用 户主 要 关心 系统 的 响应 时 间 , 所 以 性 价 比 中 的 性 能 主要 考虑 执行 时 间 。 
若 性 能 为 执行 时 间 的 倒数 , 则 性 价 比 R=1/ (执行 时 间 X 价 格 )。R 越 大 说 明 性 价 比 越 高 ,也 
即 “ 执 行 时 间 X 价 格 ” 的 值 越 小 , 则 性 价 比 越 高 。 

对 于 程序 P1,MIl 的 性 价 比 R1=1/(1sX5000),M2 的 性 价 比 R2 二 1/(0. 5sX 8000) , 根 
据 计 算 , 可 知 R2R1, 故 M2 的 性 价 比 高 ,应 选择 购买 M2。 

《5) 因为 P1 和 P2 需要 同等 考虑 ,所 以 需要 考虑 综合 性 能 。 有 多 种 计算 综合 性 能 的 方 
法 ,如 执行 时 间 总 和 、 执 行 时 间 算 术 平 均值 执行 时 间 几 何平 均值 等 。 

车 用 执行 时 间 总 和 , 则 M1 的 性 价 比 为 R1 二 1/(1003ms X 5000), M2 的 性 价 比 为 
R2 二 1/(506msX 8000) ,显然 R2>>R1, 故 M2 的 性 价 比 高 ,应 选择 M2。 

车 用 算术 平均 值 , 则 M1、M2 上 执行 时 间 的 算术 平均 值 分 别 为 501. 5ms 和 253ms。 因 
此 ,MI 的 性 价 比 为 R1=1/(501. 5ms X5000) ,M2 的 性 价 比 为 R2 王 1/(253msX8000), 显 
然 R2>R1, 故 M2 的 性 价 比 高 ,应 选择 M2。 

车 用 几何 平均 值 , 则 M1、M2 上 执行 时 间 的 几何 平均 值 都 一 样 , 约 为 54. 7。 因 此 ,M1 
的 性 价 比 为 R1==1/(54.7X5000) ,M2 的 人 性价比 为 R2= 二 1/(54. 7X8000) ,显然 RI 之 R2, 故 
MI 的 性 价 比 高 ,应 选择 M1。 

由 此 可 见 , 用 不 同 的 综合 性 能 计算 方法 得 到 的 结论 可 能 不 同 。 

5. 假定 ML 和 M2 是 以 不 同方 式 实现 同一 个 指令 集 的 两 种 机 器 , Ml 的 时 钟 频率 为 
800MHz, M2 的 时 钟 频率 为 400MHz。 在 该 指令 集中 一 共有 A、B 和 C 三 类 指令 。 有 3 种 
不 同 的 编译 器 ,其 中 Cl 和 C2 分 别 是 ML 和 M2 的 生产 厂商 提供 的 ,C3 是 第 三 方 编译 器 。 
假设 对 于 同一 个 程序 而 言 ,3 个 编译 器 生成 的 程序 代码 中 指令 总 数 相 等 ,但 是 指令 的 组 合 情 
况 各 不 相同 。 各 类 指令 在 Ml 和 M2 上 运行 时 所 需要 的 平均 时 钟 周 期 数 和 在 3 类 编译 器 生 
成 的 程序 中 所 占 的 百分比 (指令 频 度 ) 如 表 1.4 所 示 。 


表 1.4 M1 和 M2 的 CPI 以 及 3 个 程序 的 指令 频 度 


请 回答 下 列 问题 : 


计算 夫 组 成 与 系统 结 欧 习 症 解答 与 才学 指导 


(1) 如 果 M1 和 M2 都 使 用 Cl 编译 器 , 则 M1 的 生产 厂商 可 以 声称 Mi 的 性 能 是 M2 
的 多 少 倍 ? 

(2) 如 果 M1 和 M2 都 使 用 C2 编译 器 , 则 M2 的 生产 厂商 可 以 声称 Ms 的 性 能 是 M1 
的 多 少 倍 ? 

(3) 如 果 你 购买 了 Ml ,那么 你 会 选择 哪 种 编译 器 ? 如 果 你 购买 了 M2 ,你 又 会 选择 哪 种 
编译 器 ? 

(4) 如 果 其 他 所 有 指标 (包括 价格 ?都 相同 ,你 会 买 哪 台 机 器 ? 

【分 析 解 答 】 

(1) 若 ML 和 M2 都 用 Cl 编译 器 , 则 M1 的 CPI 为 2X30% 十 3X50% 十 4X20% 二 2.9， 
M2 的 CPI 为 1X30% 十 2X50% 十 1.5X20% 二 1.6;MI1 的 时 钟 频 率 为 800MHz,M2 的 时 钟 
频率 为 400MHz, 所 以 ,M1 中 一 条 指令 的 平均 执行 时 间 为 2. 9X1/800MHz=3. 625ns， 
M2 中 一 条 指令 的 平均 执行 时 间 为 1.6X1/400MHz 二 4ns; M1 和 M2 的 性 能 之 比 为 4ns/ 
3. 625ns 二 1.1, 所 以 ,M1 的 生产 商 可 以 声称 Ml 的 性 能 是 M2 的 1.1 售 。 

(2) 车 Ml 和 M2 都 用 C2 编译 器 , 则 M1 的 CPI 为 2X30% 十 3X20% 十 4X50%= 
3.2,M2 的 CPI 为 1X30% 十 2X20% 十 1. 5X50% 二 1.45;M1 的 时 钟 频率 为 800MHz, M2 
的 时 钟 频率 为 400MHz, 所 以 M1 中 一 条 指令 的 平均 执行 时 间 为 3.2X1/800MHz 一 4ns,M2 
中 一 条 指令 的 平均 执行 时 间 为 1. 45X1/400MHz=3. 625ns; M2 和 M1 的 性 能 之 比 为 tns/ 
3.625ns 王 1.1, 所 以 ,M2 的 生产 商 可 以 声称 M2 的 性 能 是 M1 的 1.1 倍 。 

(3) 由 上 述 分 析 可 知 : Cl 编译 器 在 M1 上 的 性 能 比 M2 好 ,因此 ,如 果 购 买 了 M1, 则 编 
译 器 应 选择 C1; 同 理 , 如 果 购 买 了 M2, 则 编译 器 应 选择 C2。 

(4) 从 上 述 (1) 和 (2) 分 析 结 果 来 看 ,用 生产 商 各 自 的 编译 器 无 法 衡量 M1 和 M2 的 好 
坏 ,借助 第 三 方 提供 的 编译 器 C3 来 考察 更 客观 。 若 Ml 和 M2 都 用 C3 编译 器 , 则 M1 的 
CPI 为 2X50%% 十 3X30%% 十 4X20 站 一 2.7,M2 的 CPI 为 1X50% 十 2X30% 十 1.5X20%== 
1. 4;MI1 的 时 钟 频率 为 800MHz,M2 的 时 钟 频率 为 400MHz, 所 以 M1 中 一 条 指令 的 平均 执 
行 时 间 为 2.7X1/800MHz==3. 375ns,M2 中 一 条 指令 的 平均 执行 时 间 为 1. 4X1/400MHz 
一 3.5ns;M1 和 M2 的 性 能 之 比 为 3. 5ns/3. 375ns 王 1. 04, 用 第 三 方 编译 器 C3 时 M1 的 性 
能 是 M2 的 1.04 倍 ,因此 可 选择 购买 Ml 。 

6. 若 机 器 Ml 和 M2 具有 相同 的 指令 集 , 其 时 钟 频率 分 别 为 0.8GHz 和 1.6GHz。 在 
指令 集中 有 5 种 不 同类 型 的 指令 A~E。 表 1.5 给 出 了 在 Ml 和 M2 中 每 类 指令 的 平均 时 
钟 周期 数 CPI。 


表 1.5 在 ML 和 M2 中 每 类 指令 的 平均 时 钟 周期 数 CPI 


请 回答 下 列 问 题 : 
(1) M1 和 M2 的 峰值 MIPS 各 是 多 少 ? 
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《2) 假定 程序 P 的 指令 序列 中 ,5 类 指令 具有 完全 相同 的 指令 条 数 , 则 程序 P 在 ML 和 
M2 中 运行 时 , 哪 台 机 器 更 快 ? 快 多 少 ? 在 M1 和 M2 中 执行 程序 P 时 的 平均 时 钟 周期 数 
CPI 各 是 多 少 ? 

【分 析 解 答 】 

(1) 计算 峰值 MIPS 时 应 该 选择 CPI 最 少 的 指令 , 故 在 Ml 中 可 以 选择 一 段 全 部 由 A 
类 指令 组 成 的 程序 ,其 峰值 MIPS 为 0.8GHz/1=800MJIPS ,在 M2 中 可 以 选择 一 段 全 部 由 
A 类 和 B 类 指令 组 成 的 程序 ,其 峰值 MIPS 为 1. 6GHz/2 一 800MIPS。 

(2) 程序 P 中 每 类 指令 均 占 1/5, 故 M1 的 CPI 为 CPL 王 (1 十 2 十 2 十 3 十 4)/5 二 2.4， 
M2 的 CPI 为 CPI 一 (2 十 2 十 4 十 5 十 6)/5 二 3.8。 当 然 , 不 能 根据 以 上 结果 就 说 程序 P 在 
M1 上 运行 更 快 ,因为 Ml 和 M2 的 时 钟 频率 不 同 。 

假设 程序 P 执行 指令 数 为 N, 则 P 在 Ml 上 的 执行 时 间 为 2.4X NX1/0.8=3.0N (ns); 
程序 P 在 M2 上 的 执行 时 间 为 3.8XNX1/1.6=2.375 N (ns) ,所 以 ,M2 执行 P 的 速度 更 
快 ,每 条 指令 平均 快 0. 625ns。 

从 该 题 可 以 看 出 ,虽然 程序 P 在 M1 中 每 条 指令 执行 所 花 的 时 钟 周期 数 少 ,但 是 ,因为 
M2 的 时 钟 频率 更 快 ,因而 时 钟 周期 更 短 ,使 得 每 条 指令 的 平均 执行 时 间 更 短 。 

7. 假设 同一 套 指令 集 用 不 同 的 方法 设计 了 两 种 机 器 M1 和 M2。 机 器 M1 的 时 钟 周期 
为 0. 8ns, 机 器 M2 的 时 钟 周期 为 1. 2ns。 某 个 程序 P 在 机 器 M1 上 运行 时 的 CPI 为 4, 在 
M2 上 的 CPI 为 2。 对 于 程序 P 来 说 , 哪 台 机 器 的 执行 速度 更 快 ? 快 多 少 ? 

【分 析 和 解答】 

因为 M1 和 M2 实现 的 是 同一 套 指令 集 , 所 以 程序 P 在 机 器 M1 和 M2 上 执行 的 指令 条 
数 相 同 ,假定 是 N 条 , 则 P 在 Ml 上 的 执行 时 间 为 4X0.8nsXN=3.2N (ns);P 在 M2 上 
的 执行 时 间 为 2X1.2nsX N=2.4N (ns)。 由 此 可 知 ,对 于 程序 P 来 说 , M2 的 执行 速度 更 
快 ,平均 每 条 指令 快 0. 8ns。 

8. 若 机 器 M 的 时 钟 频率 为 2GHz, 用 户 程序 P 在 M 上 执行 的 指令 条 数 为 1X10 ,其 
CPI 为 1.5, 则 了 P 在 M 上 的 执行 时 间 是 多 少 ? 若 在 机 器 M 上 从 程序 P 开始 启动 到 执行 结束 
的 延迟 时 间 是 2 秒 , 则 程序 P 的 用 户 CPU 时 间 占 整个 延迟 时 间 的 百分比 是 多 少 ? 

【分 析 解 答 】 

程序 P 在 机 器 M 上 执行 所 需 时 钟 周 期 数 为 1X10? X1.5=1.5X10, 所 和 需 时 间 为 
1.5X10*/(2X10?Hz) 一 0.75s, 程 序 P 的 用 户 CPU 时 间 在 2 秒 钟 的 延 时 内 占用 的 百分比 为 
0.75/2X100%=37.5%。 

9. 假定 某 编译 器 对 某 段 高 级 语言 程序 编译 生成 两 种 不 同 的 指令 序列 SI 和 S2, 在 时 钟 
频率 为 1GHz 的 机 器 M 上 运行 ,目标 指令 序列 中 用 到 的 指令 类 型 有 A、B、C 和 DD 共 4 类 。4 
类 指令 在 M 上 的 CPI 和 执行 两 个 指令 序列 所 执行 的 各 类 指令 条 数 如 表 1.6 所 示 。 

请 问 Sl1 和 S2 各 执行 了 多 少 条 指令 ? CPI 各 为 多 少 ? 所 含 的 时 钟 周 期 数 各 为 多 少 ? 执 
行 时 间 各 为 多 少 ? 


计算 机 组 成 与 系统 对 欧 习 是 解答 与 裘 学 持 蛙 


表 1.6 4 类 指令 在 M 上 的 CPI 和 两 个 指令 序列 所 执行 的 各 类 指令 条 数 


各 指令 的 CPI 
Sl 的 指令 条 数 
S2 的 指令 条 数 


【分 析 解 答 】 

执行 S1 的 指令 条 数 为 5 十 ?十 ?十 1 一 10,CPI 为 C5X1 十 2X2 十 2X3 十 1X4)/10=1.9， 
所 含 的 时 钟 周期 数 为 1.9X10==19, 故 执行 时 间 为 19/(1X10?) 一 19ns; 

执行 S2 的 指令 条 数 为 1 十 1 十 1 十 5 二 8,CPI 为 (1X1 二 1X2 十 1X3 十 5X4)/8==3. 25， 
所 含 的 时 钟 周 期 数 为 3.25X8==26, 故 执行 时 间 为 26/ (1X10?2) 王 26ns。 

10. 假定 机 器 M 的 时 钟 频率 为 200MHz, 程 序 P 在 机 器 M 上 的 执行 时 间 为 12 秒 。 对 
P 优化 时 ,将 其 所 有 的 乘 4 指令 都 换 成 了 一 条 左 移 两 位 的 指令 ,得 到 优化 后 的 程序 P'。 若 在 
M 上 乘法 指令 的 CPI 为 102, 左 移 指 令 的 CPI 为 2,P 的 执行 时 间 是 P' 执 行 时 间 的 1.2 倍 ， 
则 P 中 有 多 少 条 乘法 指令 被 蔡 换 成 左 移 指令 执行 ? 

【分 析 解 答 】 

P 的 执行 时 间 为 10 秒 ,P 比 P' 多 用 了 2 秒 钟 , 即 多 200MX2 一 4X108 个 时 钟 周期 ,每 
条 乘法 指令 比 左 移 指令 多 100 个 时 钟 周期 ,因为 4X10:/100= 二 4X105 ,所 以 有 400 万 条 乘法 
指令 被 替换 为 左 移 指令 执行 。 
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数据 的 机 器 级 表示 


2.1 教学 目标 和 内 容 安排 


主要 教学 目标 : 

使 学 生 掌 握 计 算 机 内 部 各 种 数据 的 宙 器 级 表示 ,并 能 将 这 些 知 识 熟 练 运用 到 高 级 语言 
和 机 器 级 语言 的 编程 和 调试 工作 中 。 

基本 学 习 要 求 : 

(1) 了 解 真 值 和 机 器 数 的 含义 。 

(2) 了 解 无 符号 整数 的 含义 、 用 途 和 表示 。 

(3) 了 解 带 符号 整数 的 表示 方法 。 

(4) 理解 为 什么 现代 计算 机 都 用 补 码 表 示 带 符号 整数 。 

(5) 掌握 在 真 值 和 各 种 编码 表示 数 之 间 进 行 转 搁 的 方法 。 

(6) 了 解 浮 点 数 表 示 格 式 , 及 其 与 表示 精度 和 表示 范围 之 间 的 关系 。 

(7) 掌握 规格 化 浮 点 数 的 概念 和 浮 点 数 规格 化 方法 。 

(8) 掌握 IEEE 754 标准 ,并 能 在 真 值 与 单 精度 格式 浮 点 数 之 间 进 行 转换 。 

(9) 能 运用 数据 表示 知识 解释 和 解决 高 级 语言 编程 中 数据 表示 和 转换 问题 。 

(10) 掌握 常用 的 十 进 制 数 的 二 进 制 编码 方法 ,如 8421 码 。 

(11) 了 解 远 辑 数据 \ 西 文字 符 和 汉字 字符 的 常用 表示 方法 ,如 ASCII 码 .GB 2312。 

(12) 了 解 常用 数据 长 度 单位 的 含义 ,如 bit、.Byte、.KB、MB、GB、TB 等 。 

(13) 了 解 大 端 和 小 端 排 列 方式 ,以 及 数据 的 对 齐 存储 方式 。 

(14) 掌握 奇偶 校 验 和 海 明 校 验 的 基本 原理 。 

(15) 掌握 CRC 码 校 验 位 的 计算 和 检 错 方法 。 


本 章 内 容 相 对 比较 容易 ,学 生 也 比较 熟悉 ,对 于 信息 的 二 进 制 表示 、 进 位 计数 制 等 简单 
内 容 ,完全 可 以 让 学 生 自学 。 如 果 课 时 不 充裕 ,对 于 十 进 制 数 的 表示 和 汉字 字符 编码 部 分 ， 
也 可 以 只 简单 介绍 其 概要 内 容 , 细 节 部 分 留 给 学 生 课 后 阅读 。 关 于 高 级 语言 中 的 各 种 数据 
类 型 与 机 器 级 数据 表示 之 间 的 关系 ,应 该 要 求学 生 掌握 ,这 对 于 提高 学 生 程序 设计 和 调试 能 


力 起 到 很 大 的 作 


目 。 其 实 ,这 部 分 内 容 很 简单 ,只 要 在 教学 过 程 中 提醒 学 生 关注 并 进行 一 些 


编程 练习 就 能 达到 目的 ,而 且 程序 设计 课程 中 大 多 也 会 介绍 这 部 分 内 容 。 
对 于 本 章 内 容 ,教学 过 程 中 普遍 存 在 的 问题 是 ,学 生 缺 乏 将 机 器 级 数据 表示 和 程序 设计 
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及 程序 调试 工作 相互 关联 的 意识 。 许 多 学 生 也 许 对 机 器 级 数据 表示 的 基本 原理 和 概念 很 了 
解 ,但 在 程序 设计 和 调试 工作 中 ,往往 不 会 运用 所 学 知识 解决 实际 问题 ,不 会 把 高 级 语言 中 
的 类 型 定义 数值 范围 、 数 据 类 型 转换 等 问题 和 本 课程 所 学 的 知识 联系 起 来 ,因而 ,所 学 知识 
没有 起 到 真正 的 作用 。 

为 了 增强 学 生 对 机 器 级 数据 表示 的 认识 ,可 以 让 学 生 亲 自 编写 相关 的 程序 ,通过 程序 的 
执行 结果 来 理解 本 章 所 学 的 知识 。 与 本 章 内 容 相关 的 编程 练习 可 以 有 很 多 ,以 下 给 出 一 些 
示例 。(1) 验证 主教 材 ? 中 表 2. 2 给 出 的 关系 表达 式 的 结果 ,并 编程 得 出 主教 材 第 2 章 习 题 
8 表 2. 14 中 的 结果 ; (2) 确 定 float 型 变量 和 double 型 变量 的 精度 ;检查 一 些 特殊 表达 式 的 
运行 结果 ,如 一 个 非 零 整数 除 以 0、 一 个 非 零 实数 除 以 0、0 除 以 0、 负数 开平 方 等 等 ; (3) 检 
查 机 器 是 大 端 还 是 小 端 方式 ,数据 是 对 齐 存放 还 是 不 对 齐 存放 。 


2.2 主要 内 容 提要 


1， 数据 的 表示 

主要 有 数值 数据 与 非 数 值 数据 两 类 。 

数值 数据 指 在 数 轴 上 有 对 应 的 点 ,能 比较 大 小 的 数 ,在 计算 机 中 有 二 进 制 数 和 十 进 制 数 
两 种 表示 形式 。 二 进 制 表示 有 无 符号 整数 、 带 符号 整数 和 浮 点 数 3 类 。 无 符号 整数 也 称 无 
符号 数 , 用 来 表示 地 址 等 正 整数 ; 带 符 号 整数 一 般 用 补 码 表示 ; 浮 点 数 用 来 表示 实数 ,现代 计 
算 机 中 多 采用 IEEE 754 标准 。 十 进 制 表示 的 主要 是 整数 ,需要 用 二 进 制 对 其 进行 编码 , 因 
此 也 称 为 BCD 码 , 最 常用 的 BCD 码 是 8421 码 。 

非 数值 数据 指 在 数 轴 上 没有 对 应 的 点 的 数据 。 主 要 包括 逻辑 值 ` 西 文字 符 和 汉字 字符 
等 。 逻 辑 值 只 有 两 个 状态 取 值 , 按 位 进行 运算 ; 西 文字 符 多 采用 7 位 ASCII 码 表 示 ; 汉 字 字 
符 有 输入 码 、 内 码 和 字模 码 , 汉 字 内 码 大 多 占 2 个 字 节 。 

2， 数据 的 宽度 

通常 以 字 节 (Byte) 为 基本 单位 表示 ,数据 长 度 单位 (如 MB、GB、TB 等 ) 在 表示 数据 容 
量 和 带宽 等 不 同 对 象 时 所 代表 的 大 小 不 同 。 

3, 数据 的 排列 

有 大 端 和 小 端 两 种 排列 方式 。 大 端 方式 以 MSB 所 在 地 址 为 数据 的 地 址 , 即 给 定 地 址 
处 存放 的 是 数据 最 高 有 效 字 节 ;小 端 方式 以 LSB 所 在 地 址 为 数据 的 地 址 , 即 给 定 地 址 处 存 
放 的 是 数据 最 低 有 效 字 节 。 

4. 数据 校 验方 式 

常用 的 数据 校 验 方式 有 3 种 : 奇偶 校 验 、 海 明 校 验 和 循环 元 余 码 校 验 。 

奇偶 校 验方 式 根据 数据 的 奇偶 性 变化 来 检 错 ,只 能 检测 奇数 个 错 ; 海 明 校 验 采 用 分 组 奇 
偶 校 验 ,SEC 只 能 纠正 一 位 错 , SEC-DED 可 纠正 一 位 错 并 检测 两 位 错 ;循环 匈 余 码 校 验 
CCRC) 通 过 某 种 数学 运算 在 数据 和 校 验 位 之 间 建 立 约定 关系 , 它 可 以 对 较 长 数据 块 进行 校 
验 而 不 增加 校 验 位 开销 ,因此 ,主要 用 于 对 大 批量 数据 的 存储 或 传输 校 验 。 
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2.3 基本 术语 解释 


机 器 数 (Computer Word) 

通常 将 数值 数据 在 计算 机 内 部 编码 表示 的 数 称 为 机 器 数 。 机 器 数 中 只 有 0 和 1 两 种 
符号 。 

真 值 (Natural Number) 

机 器 数 真正 的 值 ( 即 原来 带 有 正 负 号 的 数 ) 称 为 机 器 数 的 真 值 。 

数值 数据 (Numerical Data) 

指 有 确定 的 值 的 数据 ,在 数 轴 上 能 找到 其 对 应 的 点 ,可 以 比较 其 大 小 。 确 定 一 个 数值 数 
据 的 值 有 3 个 要 素 : 进位 计数 制定 / 浮 点 表示 和 数 的 编码 表示 。 也 就 是 说 ,给 定 一 个 数字 
序列 ,如果 不 说 明 这 个 数字 序列 是 几 进 制 数 ,小 数 点 的 位 置 在 哪里 ,采用 什么 编码 方式 ,那么 
这 个 数字 序列 的 值 是 无 法 确定 的 。 

非 数 值 数据 (Non-numerical Data) 

指 在 数 轴 上 没有 确定 的 值 的 数据 , 像 逻辑 数据 、 西 文字 符 、 汉 字 字 符 等 都 是 非 数 值 数 据 。 

基数 (Radix, Base) 

进位 计数 制 的 “底数 ”或 “ 基 ”。 例 如 ,二 进 制 数 的 基数 是 “2”, 十 进 制 数 的 基数 为 “10”, 十 
六 进 制 的 基数 为 “16”。 

无 符号 整数 (Unsigned Integer) 

当 一 个 编码 的 所 有 二 进位 都 用 来 表示 数值 时 ,该 编码 表示 的 就 是 无 符号 整数 ,也 称 为 无 
符号 数 ,可 以 看 成 是 正 整数 。 常 用 于 表示 地 址 。 

带 符号 整数 (Signed Integer) 

在 计算 机 内 部 对 正 、 负 号 进行 了 编码 的 整数 。 

定点 数 (Fixed-point Number) 

定点 数 是 计算 机 中 小 数 点 固定 在 最 左边 或 最 右边 的 数 , 有 定点 整数 和 定点 小 数 两 种 。 
定点 整数 的 小 数 点 总 是 约定 在 数 的 最 右边 ,主要 用 来 表示 现实 世界 中 的 整数 和 浮 点 数 中 的 
指数 。 定 点 小 数 的 小 数 点 总 是 约定 在 数 的 最 左边 , 主要 用 来 表示 浮 点 数 中 的 尾数 。 

定点 数 的 编码 方式 有 原 码 、 反 码 、 补 码 和 移 码 ; 浮 点 数 的 尾数 一 般 用 原 码 小 数 来 表示 ; 浮 
点 数 的 指数 一 般 用 移 码 来 表示 ;而 反 码 很 少 被 使 用 ,只 用 在 某 些 特殊 场合 。 

浮 点 数 (Floating-point Number ) 

浮 点 数 是 可 以 指定 小 数 点 在 不 同位 置 的 数 。 任 意 一 个 浮 点 数 耻 可 写成 了 F 王 MX 的 
形式 。 这 样 ,一 个 浮 点 数 就 可 以 由 两 个 定点 数 表 示 , M 称 为 浮 点 数 的 尾数 (Mantissa， 
Significans) ,用 一 个 定点 小 数 来 表示 ;E 称 为 浮 点 数 的 指数 或 阶 码 (Exponent), 用 一 个 定点 
整数 来 表示 。 

原 码 (Signed Magnitude) 

由 符号 位 直接 跟 数 值 位 构成 ,也 称 “ 符 号 -数值 > 表示 法 。 它 的 编码 规则 是 : 正 号 “十 ”用 
符号 位 “0” 表 示 , 负 号 “一 ”用 符号 位 “11” 表示, 数值 部 分 不 变 。 这 种 编码 比较 简单 ,但 计算 机 
处 理 不 方便 ,20 世纪 50 年 代 以 后 ,就 不 用 它 来 表示 整数 了 。 现 代 计 算 机 中 ,一 般 用 它 来 表 
示 浮 点 数 的 尾数 ,如 IEEE 754 标准 就 是 这 样 。 


计算 机 组 成 与 系统 对 欧 习 题解 符 与 裘 学 持 蛙 


反 码 (One’s Complement) 

一 种 对 定点 整数 或 定点 小 数 进 行 二 进 制 编码 的 编码 方案 。 由 于 计算 机 处 理 反 码 没 有 补 
码 方便 , 反 码 已 很 少 被 用 了 。 

补 码 (Two”s Complement) 

补 码 编码 规则 是 : 正 号 “十 ”用 符号 位 “0” 表 示 , 负 号 “一 ”用 符号 位 “1” 表 示 , 正 数 的 数 
值 部 分 不 变 , 负 数 的 数值 部 分 是 “各 位 取 反 , 末 位 加 1”。 这 种 编码 较 原 码 复 杂 , 但 由 于 它 是 
一 种 模 运算 系统 ,计算 机 处 理 很 方便 。 常 用 补 码 表示 带 符号 整数 。 

变形 补 码 (Four”s Complement) 

变型 补 码 是 一 种 双 符号 位 补 码 ,又 称 为 “ 模 4- 补 码 ”。 双 符号 位 可 以 用 来 检测 定点 整数 
是 否 发 生 溢 出 , 左 符号 位 为 真正 的 符号 位 , 右 符号 位 用 来 判别 是 否 溢出 。 采 用 “变形 补 码 ? 进 
行 溢出 检测 时 的 判断 规则 为 :“ 当 结果 的 两 个 符号 位 不 同时 ,发 生 溢 出 ”。 双 符号 位 通常 用 
于 保存 运算 过 程 中 进 到 高 位 的 数值 部 分 。 

移 码 (Excess Notation, Biased Notation) 

移 码 编码 规则 是 : 将 真 值 加 上 一 个 偏 置 常数 (Bias) 。 因 为 在 浮 点 数 的 加 减 运算 中 ,要 
进行 对 阶 操作 ,需要 比较 两 个 阶 的 大 小 。 用 移 码 表示 阶 码 后 ,使 得 所 有 数 的 阶 码 都 相当 于 一 
个 正 整数 ,比较 大 小 时 ,就 只 要 按 高 位 到 低位 顺序 比较 就 行 了 ,因而 , 移 码 主要 用 来 表示 浮 点 
数 的 阶 码 ,可 以 简化 阶 码 的 比较 过 程 。 

单 精度 浮 点 数 (Single Precision Floating Point) 

指 IEEE 754 标准 规定 的 32 位 浮 点 数 格式 表示 的 浮 点 数 。 阶 码 用 8 位 移 码 表示 , 偏 置 
常数 为 127, 尾 数 用 原 码 表示 ,规格 化 浮 点 数 的 最 高 位 “1? 隐 含 不 表示 , 显 式 表示 的 尾数 有 23 
位 ,所 以 一 共有 24 位 尾数 。 

双 精 度 浮 点 数 (Double Precision Floating Point) 

指 IEEE 754 标准 规定 的 64 位 浮 点 数 格式 表示 的 浮 点 数 。 阶 码 用 11 位 移 码 表示 , 偏 置 
常数 为 1023 ,尾数 用 原 码 表示 ,规格 化 浮 点 数 的 最 高 位 <1? 隐 含 不 表示 , 显 式 表 示 的 尾数 有 
52 位 ,所 以 一 共有 53 位 尾数 。 

机 器 零 (Machine“0?) 

用 一 种 专门 的 位 序列 表示 “机 器 0”。 例 如 ,IEEE 754 单 精度 浮 点 数 中 ,用 “0000 
0000H” 表 示 “ 十 0”, 用 “8000 0000H” 表 示 “ 一 0”。 当 运算 结果 出 现 阶 码 过 小 时 ,计算 机 将 该 
数 近似 表示 为 “机 器 0”。 

BCD 码 (Binary Coded Decimal, BCD) 

十 进 制 数 用 二 进 制 编码 的 形式 表示 称 为 BCD 码 。 

逻辑 数据 (Logic Data) 

逻辑 数据 用 来 表示 命题 的 “ 真 " 和 “ 假 ”, 分 别 用 “1” 和 “0” 来 表示 。 进 行 逻辑 运算 时 , 按 
位 进行 。 

ASCII 码 (American Standard Code for Information Interchange) 

目前 计算 机 中 使 用 最 广泛 的 西 文字 符 集 及 其 编码 , 即 美国 标准 信息 交换 码 (American 
Standard Code for Information Interchange) ,简称 ASCII 码 。 

汉字 输入 码 (Chinese Character Input Code) 

对 每 个 汉字 用 一 个 标准 键盘 上 按键 的 组 合 来 表示 的 编码 方式 。 一 般 分 为 数字 编码 (如 
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区 位 码 ) 、 字 音 编码 (如 微软 拼音 、 全 拼 )、 字 形 编 码 ( 如 五 笔 字 型 ) 和 形 音 编码 。 

汉字 内 码 (Chinese Character Code) 

是 指 在 计算 机 内 部 进行 汉字 存储 、 查 找 、 传 输 和 处 理 而 采用 的 编码 方式 ,通常 用 2 个 字 
节 表 示 一 个 汉字 内 码 。 

机 器 字 长 (Machine Word Length) 

一 个 二 进 制 位 (bit, 比特 ) 是 计算 机 内 部 信息 表示 的 最 小 单位 。 而 机 器 字 长 指 的 是 特定 
计算 机 中 CPU 用 于 整数 运算 的 数据 通路 的 宽度 ,通常 也 就 是 CPU 内 定点 运算 器 和 通用 寄 
存 器 的 二 进 制 位 数 。 

编 址 单位 (Addressing Unit) 

指 对 主 存单 元 编号 时 具有 相同 编号 的 二 进 制 位 数 。 主 存单 元 的 编号 称 为 地 址 。 通 常 的 
编 址 单位 为 8, 即 字 节 , 称 为 按 字 节 编 址 。 按 字 编 址 时 , 编 址 单位 为 字 。 

字 地 址 (Word Address) 

按 字 节 编 址 时 ,一 个 字 可 能 占用 几 个 内 存单 元 , 字 地 址 就 是 这 几 个 连续 内 存单 元 地 址 中 
的 最 小 值 。 

最 高 有 效 位 (Most Significant Bit, MSB) 

一 个 二 进 制 数 中 的 最 高 位 。 例 如 二 进 制 数 1000 中 的 “1”。 

最 低 有 效 位 (Least Significant Bit, LSB) 

一 个 二 进 制 数 中 的 最 低位 。 例 如 二 进 制 数 1110 中 的 “0”。 

最 高 有 效 字 节 (Most Significant Byte, MSB) 

一 个 二 进 制 数 中 的 最 高 字 节 。 例 如 二 进 制 数 1111 1111 0000 0000 1111 0000 中 的 
1111 1111。 

最 低 有 效 字 节 (Least Significant Byte,LSB) 

一 个 二 进 制 数 中 的 最 低 字 节 。 例 如 二 进 制 数 1111 1111 0000 0000 1111 0000 中 的 
1111 0000 。 

大 端 方式 (Big Endian) 

采用 字 节 编 址 方式 时 ,一 个 多 字 节 数据 (如 int、float 等 类 型 数据 ) 将 占用 多 个 主 存单 
元 。 大 端 方式 下 ,将 数据 字 的 最 低 有 效 字 节 LSB 存放 在 大 地 址 单元 中 , 即 字 地 址 是 MSB 所 
在 单元 的 地 址 。 

小 端 方式 (Little Endian) 

采用 字 节 编 址 方式 时 ,一 个 多 字 节 数据 (如 int、float 等 类 型 数据 ) 将 占用 多 个 主 存单 
元 。 小 端 方式 下 ,将 数据 字 的 最 低 有 效 字 节 LSB 存放 在 小 地 址 单元 中 , 即 字 地 址 是 LSB 所 
在 单元 的 地 址 。 

边界 对 齐 (Boundary Alignment) 

要 求 数据 的 地 址 是 相应 的 边界 地 址 。 例 如 , 按 字 节 编 址 时 ,4 字 节 长 数据 的 地 址 应 该 是 
4 的 倍数 , 即 最 末 两 位 总 是 00,2 字 节 长 数据 的 地 址 总 是 2 的 倍数 。 

检 错 和 纠 错 (Error Detect and Correct) 

数据 在 计算 机 内 部 被 处 理 的 过 程 中 会 因为 硬件 故障 而 产生 差错 。 因 此 需要 采用 数据 校 
验方 法 来 发 现 是 否 有 错 , 即 检 错 。 有 些 数据 校 验方 法 可 以 准确 发 现 错误 的 位 置 从 而 可 以 将 
二 进 制 值 取 反 , 即 纠 错 。 


计划 规 组 成 与 系统 结 欧 习 是 解答 与 才学 指导 


码 距 (Code Distance) 

两 个 码 字 中 具有 不 同 代码 的 位 数 叫 码 字 间 的 “距离 ”。 在 一 种 编码 方式 下 所 有 可 能 出 现 
的 码 字 中 ,任意 两 两 进行 比较 得 到 一 组 距离 ,其 中 的 最 小 值 称 为 这 种 编码 方式 的 “ 码 距 ?。 例 
如 ,8421 码 的 码 距 为 1。 

奇偶 校 验 (Parity Check) 

在 原 二 进 制 数 据 中 增加 一 个 奇 校 验 位 ( 偶 校 验 位 ) ,使 “1” 的 个 数 为 奇数 (偶数 ) ,最 后 在 
该 数据 传输 的 结果 中 检查 “1? 的 个 数 是 否 保持 为 奇数 (偶数 ), 如 是 , 则 认为 正确 或 有 偶数 个 
位 置 出 错 ,否则 ,认为 有 奇数 个 位 置 出 错 。 

海 明 码 (Hamming Codes) 

主要 用 于 存储 器 中 的 数据 校 验 , 将 数据 按 某 种 规律 分 成 若干 组 ,对 每 组 进行 相应 的 奇偶 
检测 。 最 终 比较 时 , 按 位 进行 异 或 操作 ,根据 异 或 操作 结果 ,确定 在 哪 一 位 发 生 了 差错 。 

循环 元 余 校 验 (Cyclic Redundancy Check,CRC) 

常用 于 外 存储 器 或 数据 通信 中 的 数据 校 验 , 检 错 纠 错 能 力 强 。 编 码 时 通过 某 种 数学 运 
算 根 据 原 数据 生成 校 验 位 ,在 检查 时 对 含 校 验 位 的 数据 进行 相应 的 数学 运算 ,根据 运算 结果 
即 可 完成 检 错 和 纠 错 。 


2.4 常见 问题 解答 


1. 真 值 和 机 器 数 的 关系 是 什么 ? 

答 : 在 计算 机 内 部 用 二 进 制 编码 表示 的 数 称 为 机 器 数 ,而 机 器 数 真正 的 值 ( 即 原来 带 有 
正 负 号 的 数 ) 称 为 机 器 数 的 真 值 , 所 以 ,它们 之 间 的 关系 就 是 同一 个 数据 的 两 种 不 同 表 示 
形式 。 

2. 什么 是 编码 ? 

答 : 编码 是 指 用 少量 简单 的 基本 符号 ,对 大 量 复杂 多 样 的 信息 进行 一 定 规律 的 组 合 。 
基本 符号 的 种 类 和 组 合 规则 是 信息 编码 的 两 大 要 素 。 例 如 ,用 10 个 阿拉 伯 数 字 表 示 数 值 ， 
电报 码 中 用 4 位 十 进 制 数字 表示 汉字 ,等 等 ,都 是 编码 的 典型 例子 。 计 算 机 内 部 处 理 的 所 有 
信息 都 是 用 0 和 1 编码 了 的 信息 。 

3. 什么 是 数字 化 编码 ? 

答 :“ 数 字 化 编码 ?就 是 对 感觉 媒体 信息 (如 数值 文字、 图 像 声音 、 视 频 等 信息 进行 定 
时 采样 ,将 现实 世界 中 的 连续 信息 转换 为 计算 机 中 离散 的 “样本 ”信息 ,然后 对 这 些 离散 的 
“样本 ”信息 用 0 和 1 进行 二 进 制 编码 。 

4. 计算 机 内 部 为 什么 用 二 进 制 来 编码 所 有 信息 ? 

(1) 二 进 制 系统 只 有 两 个 基本 符号 :“0” 和 “1”。 所 以 , 它 的 基本 符号 少 ,易于 用 稳 态 电 
路 实现 。 

(2) 二 进 制 的 编码 /计数 /运算 等 规则 简单 。 

〈3) 二进制 中 的 “0” 和 “1” 与 逻辑 命题 的 “ 真 ” 和 “ 假 ” 的 对 应 关系 简单 ,为 计算 机 中 实现 
逻辑 运算 和 程序 中 的 逻辑 判断 提供 了 便利 的 条 件 , 特 别 是 能 通过 人 逻辑 门 电路 方便 地 实现 算 
术 运 算 。 
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5, 计算 机 内 都 用 二 进 制 表示 信息 ,为 什么 还 要 引入 八进制 和 十 六 进 制 ? 

答 : 计算 机 内 部 在 进行 信息 的 存储 传送 和 运算 时 ,都 是 以 二 进 制 形式 来 表示 信息 的 。 
但 在 屏幕 上 或 书本 上 书写 信息 时 ,由 于 二 进 制 信息 位 数 多 ,阅读 、 记 忆 不 方便 ,而 十 六 进 制 、 
八进制 和 二 进 制 的 对 应 关系 简单 ,又 便于 阅读 、 记 忆 和 书写 ,所 以 引入 十 六 进 制 或 八进制 ,使 
得 人 们 在 开发 .调试 程序 和 阅读 机 器 内 部 代码 时 ,能 方便 地 用 八进制 或 十 六 进 制 来 等 价 表示 
二 进 制 信息 。 

6， 如何 表示 一 个 数值 数据 ? 计算 机 中 的 数值 数据 都 是 二 进 制 数 吗 ? 

答 : 在 计算 机 内 部 ,数值 数据 的 表示 方法 有 两 大 类 : 

(1) 直接 用 二 进 制 数 表示 。 分 为 无 符号 数 和 有 符号 数 , 有 符号 数 又 分 为 定点 数 表 示 和 
浮 点 数 表示 。 无 符号 数 用 来 表示 无 符号 整数 (如 地 址 等 信息 ); 定 点数 用 来 表示 整数 ; 浮 点 数 
用 来 表示 实数 。 

(2) 采用 二 进 制 编码 的 十 进 制 数 (Binary Coded Decimal Number, BCD 码 ) 来 表示 整 
数 ,BCD 码 的 编码 方案 有 很 多 ,但 一 般 都 采用 8421 码 ( 也 称 为 NBCD 码 ) 来 表示 。 

因此 ,计算 机 中 的 数值 数据 虽然 都 用 二 进 制 来 编码 表示 ,但 不 全 是 二 进 制 数 ,也 有 用 十 
进 制 数 表 示 的 。 因 而 有 些 处 理 器 的 指令 类 型 中 ,就 有 对 应 的 二 进 制 加 法 指令 和 十 进 制 加 法 
指令 。 

7. 为 什么 要 引入 无 符号 数 表 示 ? 

答 : 因为 有 些 情 况 下 只 要 对 正 整 数 进 行 运算 , 且 结 果 不 出 现 负 值 ,此 时 ,可 以 用 无 符号 
数 表示 变量 。 例 如 ,在 进行 地 址 或 指针 运算 时 可 用 无 符号 数 。 

8， 在 高 级 语言 程序 中 定义 的 unsigned 型 数据 是 怎么 表示 的 ? 

答 : unsigned 型 数据 就 是 无 符号 数 ,直接 用 二 进 制 对 数值 进行 编码 得 到 的 就 是 无 符 
号 数 。 

9. 为 什么 无 符号 数 运算 时 结果 可 能 会 发 生 “ 溢 出 ? 什么 叫 无 符号 数 的 “溢出 ?? 

答 : 计算 机 的 机 器 字 长 总 是 有 限 的 ,因而 机 器 数 的 位 数 有 限 , 使 得 可 表示 的 数 的 个 数 有 
限 。 对 于 ”位 二 进 制 数 ,只 能 表示 2 个 不 同 的 数 , 当 运算 结果 超过 ?位 数 时 就 可 能 发 生 
溢出 。 

对 于 无 符号 数 来 说 ,计算 机 运算 过 程 中 一 般 保 留 低 二 位 ,舍弃 高 位 。 这 样 ,会 产生 两 种 
结果 : 

(1) 剩 下 的 低 n 位 数 不 能 正确 表示 运算 结果 。 这 种 情况 下 ,意味 着 运算 的 结果 超出 了 
计算 机 能 表达 的 范围 ,有 效 数值 进 到 了 第 十 1 位 , 称 此 时 发 生 了 “溢出 ” 现象。 例如 ,对 于 4 
位 无 符号 数 相 加 运算 , 当 计算 14 十 3 时 就 会 发 生 溢出 , 即 1110 十 0011 二 10001, 结 果 中 第 一 
位 1 是 数值 部 分 ,这 个 1 丢弃 后 结果 就 不 对 了 。 

(2) 剩 下 的 低 n 位 数 能 正确 表达 计算 结果 ,也 即 高 位 的 舍 去 并 不 影响 其 运算 结果 。 例 
如 ,对 于 4 位 无 符号 数 相 减 运算 , 当 计 算 14 一 3 时 ,用 14 加 一 3 的 补 码 来 实现 , 即 1110 十 
1101 二 11011, 结 果 中 第 一 位 1 丢弃 后 ,结果 是 正确 的 。 

“对 一 个 多 于 位 的 数 丢弃 高 位 而 保留 低位 数 ” 这 样 一 种 处 理 , 实 际 上 等 价 于 “将 这 个 
多 于 位 的 数 去 除 以 2", 然 后 丢 去 商 保留 其 余数 ”的 操作 。 这 种 操作 运算 就 是 “ 模 运算 ”。 
在 一 个 模 运 算 系 统 中 ,运算 的 结果 最 终 都 是 丢弃 高 位 而 保留 低位 。 所 以 ,只 要 不 是 “溢出 ? 
( 即 只 要 真正 的 值 不 会 进 到 第 ”十 1 位 ) ,结果 就 是 正确 的 。 这 是 模 运算 系统 的 特点 。 
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10. 为 什么 现代 计算 机 都 用 补 码 来 表示 整数 ? 

答 : 和 原 码 ` 反 码 相 比 , 用 补 码 表示 定点 整数 时 ,有 以 下 4 个 好 处 : (1) 符 号 位 可 以 和 数 
值 位 一 起 参加 运算 ， (2)? 补 码 可 以 实现 模 运算 , 即 可 用 加 法 方便 地 实现 减法 运算 ; (3) 零 的 
表示 了 唯一; (4) 可 以 多 表示 一 个 最 小 负数 。 所 以 ,现代 计算 机 中 都 采用 补 码 来 表示 定点 
整数 。 

11, n 位 二 进 制 补 码 整数 的 模 是 多 少 ? 数 的 表示 范围 是 什么 ? 

答 : 位 二 进 制 补 码 整 数 的 模 是 2 ,表示 其 运算 结果 只 保留 低位 ,多 于 nn 位 的 高 位 部 
分 取 模 后 要 被 丢弃 ,其 数值 范围 为 一 2“ 2 一 十 2 2 一 1。 

12。 在 高 级 语言 编程 时 定义 的 short/int/long 型 数据 是 怎么 表示 的 ? 

答 : int 型 数据 就 是 定点 整数 ,现代 计算 机 一 般 用 补 码 来 表示 。int 型 数据 的 位 数 与 运 
行 平 台 和 编译 器 有 关 , 一 般 是 32 位 或 16 位 。long 型 数据 和 short 型 数据 也 都 是 定点 整数 ， 
用 补 码 表示 ,只 是 位 数 不 同 ,分 别 是 长 整 型 和 短 整 型 数 。 

13. 在 C 语言 程序 中 ,关系 表达 式 “ 一 2147483648 = 二 二 2147483648U” 的 结果 为 什么 为 
“ 真 ?? 

答 : 关系 表达 式 “ 一 2147483648 一 一 2147483648U” 的 左边 是 负数 ,右边 是 正 数 , 因 此 ， 
左右 两 数 看 似 不 等 ,结果 似乎 应 该 为 “ 假 >。 但 是 ,C 语言 中 ,如 果 执 行 一 个 运算 时 同时 有 无 
符号 整数 (如 unsigned int) 和 带 符号 整数 (如 int) 参 加 ,那么 ,C 编译 器 会 隐 含 地 将 带 符号 整 
数 强制 类 型 转换 为 无 符号 整数 ,因此 ,在 上 面 的 关系 表达 式 运 算 中 ,左边 的 带 符号 整数 
“一 2147483648” 对 应 的 机 器 数 “1000 0000 0000 0000 0000 0000 0000 0000” 被 解释 成 无 符号 
数 , 其 值 为 22 ,和 右边 的 无 符号 数 “2147483648U” 的 值 完全 相同 ,因而 结果 为 < 真 ”。 

14. 定点 整数 在 数 轴 上 分 布 的 点 之 间 都 是 等 距 的 吗 ? 

答 : 是 的 。 定 点 整数 在 数 轴 上 的 点 总 是 在 整数 值 上 , 即 […, 一 5, 一 4, 一 3, 一 2, 一 1,0， 
1,2,3,4,5,…], 相 邻 数 据 间隔 总 是 1。 

15. 为 什么 要 引入 浮 点 数 表 示 ? 

答 : 因为 定点 数 不 能 表示 实数 ,而 且 表 数 范围 小 ,所 以 ,要 引入 浮 点 数 表示 。 

16. 为 什么 浮 点 数 的 阶 (指数 ) 要 用 移 码 表示 ? 

答 : 因为 在 浮 点 数 的 加 减 运 算 中 ,要 进行 对 阶 操作 ,需要 比较 两 个 阶 的 大 小 。 移 码 表示 
的 实质 就 是 把 阶 加 上 一 个 偏 置 常 数 ,使 得 所 有 数 的 阶 码 都 转换 为 一 个 正 整数 ,比较 大 小 时 ， 
就 只 要 按 高 位 到 低位 顺序 比较 ,因而 ,引入 移 码 可 以 简化 阶 的 比较 过 程 。 

17, 浮 点 数 如 何 表示 0? 

答 : 用 一 种 专门 的 位 序列 表示 0, 例 如 ,IEEE 754 单 精度 浮 点 数 中 ,用 “0000 0000H” 表 
示 “ 十 0”, 用 “8000 0000H” 表 示 “ 一 0”。 当 运算 结果 出 现 阶 码 过 小 时 ,计算 机 将 该 数 近似 表 
示 为 0, 称 为 “机 器 0”。 

18， 现代 计算 机 中 采用 什么 标准 来 表示 浮 点 数 ? 

答 : 早期 的 计算 机 各 自 采用 不 同 的 浮 点 数 表 示 格 式 ,因而 ,在 不 同 计算 机 之 间 进 行 数据 
交换 时 ,就 会 发 生 数 据 格式 不 统一 的 问题 。 所 以 ,专门 制定 了 IEEE 754 标准 用 来 规定 计算 
机 中 的 浮 点 数 表示 格式 。 现 代 计 算 机 中 都 采用 IEEE 754 标准 来 表示 浮 点 数 。 

19， 为 什么 浮 点 数 要 采用 规格 化 形式 表示 ? 

答 : 为 了 使 浮 点 数 中 能 尽量 多 地 表示 有 效 位 数 , 提 高 浮 点 数 运算 的 精度 。 
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20. 如 何 判断 一 个 浮 点 数 是 否 是 规格 化 数 ? 

答 : 只 要 看 转换 为 真 值 后 ,其 尾数 的 第 一 位 是 否 一 定 是 非 零 数 。 因 此 ,对 于 原 码 编码 的 
尾数 来 说 ,只 要 看 尾数 的 数值 部 分 第 一 位 是 否 为 1; 对 于 补 码 表示 的 尾数 ,只 要 看 符号 位 和 
尾数 最 高 位 是 否 相反 。 

21, 浮 点 数 表 示 的 精度 和 数值 范围 取决 于 什么 ? 

答 : 浮 点 数 的 精度 取决 于 尾数 的 位 数 , 而 数值 范围 取决 于 阶 码 的 位 数 。 在 浮 点 数 总 位 
数 不 变 的 情况 下 , 阶 码 位 数 越 多 , 则 尾数 位 数 越 少 。 即 表 数 范围 越 大 , 则 精度 越 差 ( 数 变 稀 
玖 )。 

22， 基数 的 大 小 对 表 数 范围 和 精度 有 什么 影响 ? 

答 : 基数 越 大 , 则 范围 越 大 ,但 精度 变 低 ( 数 变 稀 玖 ) 。 

23. 在 高 级 语言 编程 中 ,float 和 double 型 数据 是 怎么 表示 的 ? 

答 : 现代 计算 机 用 IEEE 754 标准 表示 浮 点 数 ,其 中 32 位 单 精度 浮 点 数 就 是 float 型 数 
据 ,64 位 双 精 度 浮 点 数 就 是 double 型 数据 。 

24， 在 高 级 语言 编程 中 ,long double 型 数据 是 怎么 表示 的 ? 

答 : long double 型 数据 的 长 度 和 格式 随 编译 器 和 处 理 器 类 型 的 不 同 而 有 所 不 同 。 例 
如 ,Microsoft Visual C++ 6.0 版 本 以 下 的 编译 器 都 不 支持 该 类 型 ,因此 ,用 其 编译 出 来 的 
目标 代码 中 long double 和 double 一 样 ,都 是 64 位 双 精 度 ;在 IA-32 上 使 用 gcc 编译 器 时 ， 
long double 类 型 数据 采用 Intel x86 FPU 的 80 位 双 精 度 扩展 格式 (1 位 符号 位 ;、15 位 阶 码 
e、1 位 显 式 首位 有 效 位 (Explicit Leading Significand Bit)7 和 63 位 尾数 用 表示 ;在 SPARC 
和 PowerPC 处 理 器 上 使 用 gcc 编译 器 时 ,long double 类 型 数据 采用 相应 的 128 位 双 精 度 扩 展 
格式 (1 位 符号 位 s、15 位 阶 码 e 和 112 位 尾数 f, 采 用 隐藏 位 , 故 有 效 位 数 为 113 位 ) 表 示 。 

25，C 语言 程序 中 ,为 什么 关系 表达 式 “123456789 一 一 (int) (float)123456789” 的 结果 
为 “ 假 ”, 而 关系 表达 式 “123456== = (intb) (float)123456” 和 “123456789 一 一 (int) (double) 
123456789” 的 结果 都 为 “ 真 ”? 

答 : 首先 应 该 明白 ,在 C 语言 中 ,float 类 型 对 应 IEEE 754 单 精 度 浮 点 数 格式 ,也 即 
float 型 数据 的 有 效 位 数 只 有 24 位 (相当 于 有 7 位 十 进 制 有 效 位 数 );double 类 型 对 应 IEEE 
754 双 精 度 淫 点 数 格 式 , 有 效 位 数 有 53 位 (相当 于 有 17 位 十 进 制 有 效 位 数 ) ;int 类 型 为 32 
位 整数 ,有 31 位 有 效 位 数 (最 大 数 为 2147483647) 。 

整数 123456789 的 有 效 位 数 为 9 位 ,转换 为 float 型 数据 后 肯定 发 生 了 有 效 位 数 丢失 ， 
再 转换 为 int 型 数据 时 ,已 经 不 是 123456789 了 ,所 以 ,等 式 “123456789 二 (int) (float) 
123456789” 两 边 的 值 不 相等 。 

数据 改 为 123456 后 ,有 效 位 数 只 有 6 位 ,转换 为 float 型 数据 后 有 效 位 数 没有 丢失 , 因 
而 数值 没 变 ,再 转换 为 int 型 数据 时 ,还 是 123456, 所 以 ,等 式 “123456 二 二 (int) (float) 
123456” 两 边 的 值 相 等 。 

整数 123456789 的 有 效 位 数 为 9 位 ,转换 为 double 型 数据 后 ,不 会 发 生 有 效 位 数 丢 失 ， 
再 转换 为 int 型 数据 时 ,还 是 123456789, 所 以 ,等 式 “123456789 = = (int)(double) 
123456789” 两 边 的 值 相 等 。 

26. 位 数 相同 的 定点 数 和 浮 点 数 中 ,可 表示 的 浮 点 数 个 数 比 定点 数 个 数 多 玛 ? 

答 : 不 是 的 。 可 表示 的 数据 个 数 取决 于 编码 所 采用 的 位 数 。 编 码 位 数 一 定 , 则 编码 出 
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”的 数据 个 数 就 是 一 定 的 。n 位 编码 最 多 只 能 表示 2” 个 数 ,所 以 ,对 于 相同 位 数 的 定点 数 和 
| 浮 点 数 来 说 ,可 表示 的 数据 个 数 应 该 一 样 多 。 但 是 ,有 时 由 于 一 个 值 可 能 有 两 个 或 多 个 编码 
| 对 应 ,编码 个 数 会 有 少量 差异 。 

27， 如何 进行 BCD 码 的 编码 ? 

答 : 每 位 十 进 制 数 的 取 值 可 以 是 0/1/2/…/9 这 十 个 数 之 一 ,因此 ,每 一 个 十 进 制 数位 
必须 至 少 有 4 位 二 进 制 位 来 表示 。 而 4 位 二 进 制 位 可 以 组 合成 16 种 状态 ,去掉 10 种 状态 
后 还 有 6 种 元 余 状态 ,所 以 从 16 种 状态 中 选取 10 种 状态 表示 十 进 制 数位 0 一 9 的 方法 有 很 
多 ,可 以 产生 多 种 BCD 码 方案 。 大 的 方面 可 分 为 有 权 码 和 无 权 码 两 种 。 

有 权 码 指 表示 每 个 十 进 制 数位 的 4 个 二 进 制 数 位 ( 称 为 基 2 码 ) 都 有 一 个 确定 的 权 。8421 
码 是 最 常用 的 十 进 制 有 权 码 ;无 权 码 指 表示 每 个 十 进 制 数位 的 4 个 基 2 码 没有 确定 的 权 。 

28. 逻辑 数据 在 计算 机 中 如 何 表 示 ? 如何 运 算 ? 

答 : 逻辑 数据 用 来 表示 命题 的 “ 真 ? 和 “ 假 ”, 分 别 用 “1” 和 “0” 来 表示 。 进 行 逻 辑 运算 
时 , 按 位 进行 。 

29， 汉字 的 区 位 码 、 国 标 码 和 机 内 码 有 什么 区 别 ? 

答 : GB 2312 字符 集 由 94 行 .94 列 组 成 , 行 号 称 为 区 号 , 列 号 称 为 位 号 ,各 占 7 位 , 共 14 
位 ,区 号 在 左 、 位 号 在 右 , 称 为 汉字 的 区 位 码 , 它 指出 了 该 汉字 在 码 表 中 的 位 置 。 

汉字 的 国标 码 是 将 区 号 、 位 号 各 加 上 32( 即 十 六 进 制 的 20H) 后 ,再 在 前 后 7 位 前 各 
加 0。 

汉字 的 内 码 需 2 个 字 节 才能 表示 ,可 以 在 国标 码 的 基础 上 产生 汉字 机 内 码 ,一 般 是 将 国 
标 码 的 两 个 字 节 的 第 一 位 设置 成 “1”。 

例如 ,已 知 一 个 汉字 的 国标 码 为 343AH ,前 后 两 个 字 节 各 减 32(20H) 得 到 区 位 码 为 
343AH 一 2020H= 二 141AH, 所 以 区 号 为 20(14H) ,位 号 为 26(1AH); 机 内 码 是 将 国标 码 的 两 
个 字 节 的 最 前 面 一 位 变 为 "1”, 因 此 ,机 内 码 为 BIBAH 。 

30，MSB(LSB) 表 示 最 高 ( 低 ) 有 效 字 节 还 是 最 高 ( 低 ) 有 效 位 ? 

答 : MSB 的 含义 可 能 是 最 高 有 效 字 节 (Most Significant Byte) ,也 可 能 是 最 高 有 效 位 
(Most Significant Bit) ,具体 表示 哪 一 个 含义 要 看 上 下 文 。 同 样 ,LSB 的 含义 可 能 是 最 低 有 
效 字 节 (Least Significant Byte) ,也 可 能 是 最 低 有 效 位 (Least Significant Bit) 。 

31. 有 时 用 "“ 字 ”表示 数据 的 宽度 ,一 个 “ 字 ” 到 底 有 多 少 位 ? 

答 : 除了 用 “比特 (Bit)” 和 “ 字 节 (Byte)” 来 表示 一 个 数据 的 宽度 外 ,有 时 也 用 “ 字 
(Word)” 来 表示 数据 宽度 的 单位 。 不 同 的 计算 机 ,其 “ 字 ” 的 长 度 和 组 成 不 完全 相同 ,有 的 由 
2 个 字 节 组 成 ,有 的 由 4 个 8 个 甚至 16 个 字 节 组 成 。 

32. 一 个 “ 字 ” 的 宽度 就 是 一 个 “机 器 字 长 ” 吗 ? 

答 : 不 是 。“ 机 器 字 长 ”是 计算 机 的 一 个 非常 重要 的 指标 。 通 常 称 32 位 机 器 或 64 位 机 
器 ,就 是 指 机 器 的 字 长 是 32 位 或 64 位 。 一 般 情 况 下 ,机 器 字 长 定义 为 CPU 中 一 次 能 够 处 
理 的 二 进 制 整数 的 位 数 ,实际 上 就 是 CPU 中 整数 运算 数据 通路 的 位 数 。 

“ 字 ” 作 为 信息 宽度 的 计量 单位 ,对 于 某 个 系列 机 来 说 ,其 字 宽 总 是 固定 的 。 例 如 ,在 
80x86 系列 中 ,一 个 字 的 宽度 为 16 位 ,因此 ,32 位 是 双 字 ,64 位 是 四 字 。 在 IBM 303X 系列 
中 ,一 个 字 的 宽度 为 32 位 ,所 以 16 位 为 半 字 ,32 位 为 单字 ,64 位 为 双 字 。 

一 个 “ 字 ” 的 宽度 可 以 不 等 于 机 器 字 长 。 例 如 ,在 Intel 微 处 理 器 中 ,从 80386 开始 就 都 
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是 32 位 或 以 上 的 机 器 了 , 即 机 器 字 长 至 少 为 32 位 ,但 其 字 的 宽度 都 定义 为 16 位 。 

33, 在 表示 存储 容量 和 带宽 时 经 常用 到 KB、MB、GB、TB 等 表示 数据 量 的 单位 ,为 什么 
有 时 1MB 等 于 10 字 节 ,有 时 又 等 于 22 字 节 呢 ? 

答 : 当 表 示 二 进 制 存储 容量 时 ,度量 单位 用 2 的 寡 次 ,例如 , 若 主 存 容 量 为 1GB, 则 表示 
主 存 有 2” 字 节 。 当 描述 距离 ,频率 等 数值 时 ,通常 用 10 的 寡 次 表示 ,因而 在 由 时 钟 频率 计 
算得 到 的 总 线 带宽 或 外 设 数据 传输 率 中 ,度量 单位 表示 的 也 是 10 的 短 次 。 例 如 , 若 总 线 带 
宽 为 1GB/s, 表 示 总 线 每 秒 传输 10? 字 节 。 为 区 分 这 种 差别 ,通常 用 KK 表示 1024, 用 上 表示 
1000 ,而 其 他 前 缀 字母 均 为 大 写 ,表示 的 大 小 由 其 上 下 文 决定 。 


2.5 单项 选择 题 
1. 计算 机 中 的 所 有 信息 都 以 二 进 制 表示 的 原因 是 (  )。 
A. 信息 处 理 方便 B. 运算 速度 快 
C. 节约 元 器 件 D. 物理 器 件 特性 所 致 
2. 引 人 和 八进制 和 十 六 进 制 的 目的 是 ( ”)。 
A. 节约 元 件 
B. 实现 方便 


C. 可 以 表示 更 大 范围 的 数 
D. 用 于 等 价 地 表示 二 进 制 ,便于 阅读 和 书写 
3. 108 对 应 的 十 六 进 制 形式 是 ( )。 


A. 6CH B. B4H C. 5CH D. 63H 
4. 下 列 数 中 最 小 的 数 为 2 
A. (1001 0110)， B. (63)s 
C. (1001 0110)acn D. (2F)1 
5. 下 列 数 中 最 小 的 数 为 ( De 
A. (1110 0101)， B. (93)yw 
C. (1001 0010)acn D. (5A)ie 
6. 负 零 的 补 码 表示 为 ( ) 。 
A. 1 00…00 B. 0 00…00 C. 0 11…11 D. 1 11…11 
7. [zj 三 Zo. zizz…zn(2 为 整数 ), 它 的 模 是 ( )。 
A 了 C.1 D; 2 
8. [z]# 一 zozlzz…za(z 为 整数 ), 它 的 模 是 ( )。 
J er B. 2” | DD: .2—1 
9. 下 列 编码 中 , 零 的 表示 形式 是 唯一 的 编码 是 ( 
A. 反 码 B. 原 码 C. 补 码 D. 原 码 和 补 码 


10. 在 下 列 有 关 补 码 和 移 码 关系 的 叙述 中 ,错误 的 是 ( )。 
A. 相同 位 数 的 补 码 和 移 码 表示 具有 相同 的 表 数 范 转 
B. 零 的 补 码 和 移 码 表示 相同 
C. 同一 个 数 的 补 码 和 移 码 表示 ,其 数值 部 分 相同 ,而 符号 位 相反 
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D. 一 般 用 移 码 表示 浮 点 数 的 阶 ,而 补 码 表示 定点 整数 

计算 机 内 部 的 带 符号 整数 大 多 用 补 码 表示 ,以 下 是 一 些 关 于 补 码 特点 的 叙述 : 
Q@ 零 的 表示 是 唯一 的 

@ 符号 位 可 以 和 数值 部 分 一 起 参加 运算 

@ 和 其 真 值 的 对 应 关系 简单 、 直 观 

@ 减法 可 用 加 法 来 实现 

以 上 叙述 中 ,哪些 选项 是 补 码 表示 的 特点 ?〈  ) 

A. DO B. OO 、@ C. DO.@ D. OO.@ 


12. 假定 某 数 z 一 一 0100 1010B ,在 计算 机 内 部 的 表示 为 1011 0110B, 则 该 数 所 用 的 编 
码 方法 是 ( )。 
A. 原 码 B. 反 码 C. 补 码 D. 移 码 
13. 设 寄存 器 位 数 为 8 位 ,机 器 数 采 用 补 码 形式 ( 含 一 位 符号 位 ), 则 十 进 制 数 一 26 存放 
在 寄存 器 中 的 内 容 为 ( )。 
A. 26H B. 9BH C. E6H D. 5AH 
14. 一 1029 的 16 位 补 码 用 十 六 进 制 表示 为 ( 7 
A. 0405H B. 7BFBH C. 8405H D. FBFBH 
15. 考虑 以 下 C 语言 代码 


16. 


上 人 


18. 


19. 


20, 


Short si=-8196; 


unsigned short usi=si; 


执行 上 述 程序 段 后 ,usi 的 值 是 ( Ns 

A. 8196 B. 34572 C. 57339 D. 57340 
设 Lz] 和 一 1. Xixzxsx4，, 当 满足 ( ) 时 ,z> 一 1/2 成 立 。 

A. zi 必须 为 1,zaxzsz4 至 少 有 一 个 为 1 

B. zz 必须 为 1,zaxzszt 任意 

C. zi 必须 为 0,zazszt 至 少 有 一 个 为 1 

D. zi 必须 为 0,zazsz 任意 


设 z 一 一 0.1011B, 则 8 位 补 码 [z]# 为 ( ” )。 

A. 1.101 1000B B. 1.000 1011B 

C. 1.010 1000B D. 1.000 0101B 

16 位 无 符号 数 所 能 表示 的 数值 范围 是 (  €)。 

A. 0~(2*—1) B. 0~ (2 —1) 

C. 0 一 2 D. 0 一 2 

16 位 补 码 整数 所 能 表示 的 范围 是 (。 )。 

A. 一 中 一 十 (25 一 1) B. (221) 
CG. 2 = D. —(2*—1D 一 十 (28 一 1 
若 浮 点 数 尾 数 用 补 码 表示 , 则 下 列 数 中 为 规格 化 尾数 形式 的 是 (  )。 
A. 1.110 0000B B. 0.011 1000B 


C. 0.010 1000B D. 1.000 1000B 
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21. 若 浮 点 数 尾数 用 原 码 表示 , 则 下 列 数 中 为 规格 化 尾数 形式 的 是 ( )。 


A. 1.110 0000B B. 0.011 1000B 
C. 0.01 01000B D. 1.000 1000B 
22. 用 于 表示 浮 点 数 阶 码 的 编码 通常 是 ( ) 。 
A. 原 码 B. 补 码 C. 反 码 D. 移 码 
23. 若 某 数 采 用 IEEE 754 单 精 度 浮 点 数 格式 表示 为 4510 0000H , 则 其 值 是 ( a 
A. (+1.125)1 X2™ B. (+1.125)% X21 
C. (+0.125)1 X21 D. (+0.125),, X2* 
24. 若 某 数 采用 IEEE 754 单 精度 浮 点 数 格式 表示 为 C820 0000H, 则 其 值 是 ( )。 
A. (—1.01), X21 B. (—1.01)w X2% 
C. (—1.25) X27 D. (—1.25)1o X2% 


25. 假定 变量 i、f 的 数据 类 型 分 别 是 int、float。 已 知 i=12345, f= 二 1.2345e3, 则 在 一 
个 32 位 机 响 中 执行 下 列表 达 式 时 ,结果 为 “ 假 ” 的 是 (  )。 
A. i== (int) (float)i B. i==(int)(double)i 
C. f== (float) (int)f D. f== (float) (double)f 
26. IBM 370 的 短 浮 点 数 格式 中 ,总 位 数 为 32 位 ,左边 第 一 位 (b) 为 数 符 , 随 后 7 位 
(b1~by) 为 阶 码 ,用 移 码 表示 , 偏 置 常数 为 64 ,右边 24 位 (一 ba ) 为 6 位 十 六 进 制 原 码 小 数 
表示 的 尾数 ,采用 规格 化 形式 。 若 将 十 进 制 数 一 265. 625 用 该 浮 点 数 格式 表示 , 则 应 表示 为 
( ””)。( 用 十 六 进 制 形式 表示 )》 
A. C310 9A00H B. 4310 9Ao0H 
C. 8310 9Ao0H D. 0310 9Ao0H 
27. 假定 两 种 浮 点 数 表示 格式 的 位 数 都 是 32 位 ,但 格式 1 的 阶 码 长 ,尾数 短 , 而 格式 2 
的 阶 码 短 ,尾数 长 ,其 他 所 有 规定 都 相同 , 则 它们 可 表示 的 数 的 精度 和 范围 为 (  )。 
A. 两 者 可 表示 的 数 的 范围 和 精度 均 相 同 
B. 格式 1 可 表示 的 数 的 范围 更 小 ,但 精度 更 高 
C. 格式 2 可 表示 的 数 的 范围 更 小 ,但 精度 更 高 
D. 格式 1 可 表示 的 数 的 范围 更 大 , 且 精 度 更 高 
28. 在 一 般 的 计算 机 系统 中 , 西 文字 符 编码 普遍 采用 (  )。 
A. BCD 码 B. ASCII 码 
C. 格雷 码 D. CRC 码 
29. 假定 某 计 算 机 按 字 节 编 址 ,采用 小 端 方式 ,有 一 个 float 型 变量 x 的 地 址 为 FFFF 
C000H,z= 二 1234 5678H , 则 在 内 存单 元 FFFF C001H 中 存放 的 内 容 是 ( )。 
A. 1234H B. 34H 
C. 56H D. 5678H 
30. 下 面 有 关机 器 字 长 的 叙述 中 ,错误 的 是 ( )。 
A. 机 器 字 长 是 指 CPU 中 定点 运算 数据 通路 的 宽度 
B. 机 器 字 长 一 般 与 CPU 中 寄存 器 的 位 数 有 关 
C. 机 器 字 长 决定 了 数 的 表示 范围 和 表示 精度 
D. 机 器 字 长 对 计算 机 硬件 的 造价 没有 影响 
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31. 下 面 是 关于 计算 机 中 存储 器 容量 单位 的 令 述 ,其 中 错误 的 是 ( ”)。 
A. 最 小 的 计量 单位 为 位 (bit) ,表示 一 位 “0” 或 1” 
B. 最 基本 的 计量 单位 是 字 节 (Byte) ,一 个 字 节 等 于 8b 
C. 一 合计 算 机 的 编 址 单位 指令 字 长 和 数据 字 长 都 一 样 , 且 是 字 节 的 整数 信 
D. 主 存 容量 为 1IKB, 其 含义 是 主 存 中 能 存放 1024 个 字 节 的 二 进 制 信息 
32. 假定 下 列 字 符 编 码 中 含有 奇偶 检验 位 ,但 没有 发 生 数据 错误 ,那么 采用 奇 校 验 的 字 


H 


符 编码 是 (。”)。 
A. 0101 0011 B. 0110 0110 
C. 1011 0000 D. 0011 0101 


33. 假设 需要 传送 的 一 个 数据 块 的 长 度 为 10 位 ,对 每 个 数据 块 采用 CRC 校 验 , 若 约定 


生成 多 项 式 为 x 十 1, 则 对 应 的 CRC 码 的 位 数 是 ( A 


A.3 B. 4 C. 13 D. 14 
34. 假设 某 个 需要 校 验 的 数据 为 0110 0101B, 采 用 CRC 校 验 , 生 成 多 项 式 为 zt 十 z 十 1， 


则 对 应 的 校 验 码 是 (。 ”)。 


010 


A. 0010 B. 0110 C. 1110 D. 1111 

【参考 答案 】 

1.D 2.D 3. A 4. D 5.D 6. B 7.D 
8. A 9.C 10. B 11. D 12. C 13.C 14. D 
15. D 16. D 下 /ee 18. A 19. A 20. D 21. A 
22，D 23. B 24. C 25. C 26. A 27. C 28. B 
29. C 30. D 31.C 32.C 33. C 34. A 

2.6 分 析 应 用 题 


1. 实现 下 列 各 数 的 转换 。 

(1) (25.8125), =(?),=(?)s = (7)1e 

(2) (101101.011),=(?)»% =(?)s = (7)1 = (7?) 

(3) (0101 1001 0110.0011)821 =(?)1 = (7); 一 (?)16 

(4) 〈4E. C)16 一 (?)1o 一 (?)2 

【分 析 解 答 】 

〈《1)〈25.8125)io 一 (11001. 1101): 一 (31. 64)s 一 (19. D)7is 

(2) (101101. 011); = (45. 375)1 = (55. 3)s = (2D. 6)1s = (0100 0101. 0011 0111 

1) 8421 

(3) (0101 1001 0110.0011)81 =(596.3)1 = (1001010100. 0100) :一 (254. 4)16 
《4)〈4E. C)is 一 (78.75)io 一 (1001110. 11); 

2. 假定 机 器 数 为 8 位 (1 位 符号 ,7 位 数值 ), 写 出 下 列 各 二 进 制 数 的 原 码 和 补 码 表示 。 
上 0. 1001 , 一 0. 1001 , 十 1. 0 ,一 1.0, 十 0.010100 ,一 0.010100 ,十 0, 一 0 

【分 析 解 答 】 

上 述 各 二 进 制 数 的 原 码 和 补 码 表示 在 表 2. 1 中 给 出 。 
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表 2.1 小 数 的 原 码 和 补 码 表示 | 
数 什 原 码 补 码 | 
十 0. 1001 0. 1001000 0. 1001000 
一 0. 1001 1. 1001000 1.0111000 
+1.0 溢出 溢出 
一 1.0 溢出 1, 0000000 
十 0. 010100 0.0101000 0.0101000 
一 0.010100 1.0101000 1, 1011000 
十 0 0. 0000000 0. 0000000 
一 0 1.0000000 0.0000000 


3. 假定 机 器 数 为 8 位 (1 位 符号 ,7 位 数值 ), 写 出 下 列 各 二 进 制 数 的 补 码 和 移 码 表示 。 
十 1001, 一 1001, 十 1, 一 1, 十 10100, 一 10100, 十 0, 一 0 

【分 析 解答 】 了 

上 述 各 二 进 制 数 的 补 码 和 移 码 表示 在 表 2. 2 中 给 出 。 


表 2.2 整数 的 补 码 和 移 码 表示 


数 值 补 码 移 码 ( 偏 兽 常数 一 1 0000000) 
十 1001 0 0001001 1 0001001 
一 1001 1 1110111 0 1110111 
十 0 0000001 1 0000001 
< 1 1111111 0 1111111 
十 10100 0 0010100 1 0010100 
一 10100 1 1101100 0 1101100 
十 0 0 0000000 1 0000000 
一 和 0 0000000 1 0000000 


4. 设 [z]# 王 1. zizzzasziy 当 zizzzszi 满足 什么 条 件 时 ,zx 二 一 1/2 成 立 ? 

【分 析 解 答 】 

补 码 的 编码 规则 是 :“ 正 数 的 补 码 ,其 符号 位 为 0, 数值 位 不 变 ; 负 数 的 补 码 , 其 符号 位 为 
1 ,数值 位 各 位 取 反 ,末尾 加 1?。 从 形式 上 来 看 ,[z]# 的 符号 位 为 1, 故 zx 一 定 是 负数 。 因 
此 ,绝对 值 越 大 ,数值 越 小 ,因而 要 满足 x 二 一 1/2, 则 z 的 绝对 值 必须 大 于 1/2。 因 此 ,zi 必 
须 为 0,zszs zt 至 少 有 一 个 为 1, 这 样 ,各 位 取 反 末尾 加 1 后 ,zi 一 定 为 1, zzxsz4 中 至 少 有 
一 个 为 1, 使 得 z 的 绝对 值 保证 大 于 1/2。 因 此 ,zi 必须 为 0,zxsxszs 至 少 有 一 个 为 1。 

5. 已 知 [z]h#，, 求 z。 

(1) [z]* =1. 1100001B (2) [z]# =1 0000000B 
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C3) [za =0.1111111B (4) [zl#=1 1111111B 
【分 析 解 答 】 

(1) z 一 一 0.0011111B (2) z 一 一 10000000B 一 一 128 
(3) z=0.1111111B (4) z= —00000001B= 一 1 


6. 将 以 下 十 进 制 数 表示 成 无 符号 整数 时 至 少 需要 几 个 二 进位 ? 

156 ,820,1200,4503 

【分 析 解 答 】 

27 一 1 过 156 过 2 一 1, 故 至 少 需 要 8 位。 

2 一 1 < 820 一 22 一 1, 故 至 少 需要 10 位 。 

2 一 1 < 1200< 2 一 1, 故 至 少 需要 11 位。 

2 一 1] < 4503 过 2 一 1, 故 至 少 需要 13 位 。 

7. 假定 某 程序 中 定义 了 3 个 变量 z、y 和 x, 其 中 zx 和 xz 为 int 型 ,y 为 short 型 。 当 
ZX 二 一 258,y 二 一 20 时 ,执行 赋值 语句 z= 二 x 一 y 后 ,存放 zx 的 寄存 器 中 的 内 容 是 多 少 ? 

【分 析 和 解答】 

现代 计算 机 中 带 符 号 整数 都 是 用 补 码 表 示 的 ,因此 ,本 题 可 以 直接 计算 = 的 值 ,然后 将 
zz 的 补 码 形式 求 出 来 ,也 可 以 先 将 x 和 yy 的 补 码 求 出 ,再 通过 补 码 加 法 求 出 = 的 补 码 表示 。 
显然 ,前 一 种 思路 效率 较 高 。 对 于 前 一 种 思路 ,执行 赋值 语句 后 ,x 二 一 238, 因 此 ,问题 就 变 
成 了 求 一 238 的 补 码 表示 ,其 结果 为 [一 000 0000 0000 0000 0000 0000 0000 1110 1110B]# 一 
1111 1111 1111 1111 1111 1111 0001 0010B=FFFF FF12H。 

8. 假定 sizeof (int) 一 4, 表 2. 3 中 第 一 列 给 出 了 C 语言 程序 中 的 关系 表达 式 , 请 参照 已 
有 表 栏 内 容 完成 表 中 后 3 栏 内 容 的 填写 ,并 对 关系 表达 式 “2147483647 < (int) 
2147483648U” 的 结果 进行 说 明 。 


表 2.3 关系 表达 式 的 运算 结果 


2147483647 之 一 2147483647 一 1 


2147483647U> 一 2147483647 一 1 


2147483647<<(int)2147483648U 


-1>-—2 


(unsigned)—1>—2 


【分 析 解 答 】 
按照 题目 要 求 填 表 2. 4: 


数据 的 机 器 级 表示 


表 2.4 与 表 2.3 对 应 的 关系 表达 式 的 运算 结果 1 
关系 表达 式 说 明 | 
0 王 一 0U 00…0B 王 00…0B 
人 11…1B( 一 1)<00…0B(0) 
一 1<6U 11…1B (22 一 1) 盖 00…0B(CO) 


2147483647 之 一 2147483647 一 1 011…1B(23 —1)>100%…0B(—2”») 


2147483647U> 一 2147483647 一 1 011…1B(22 一 1)<100…0B(22 ) 


2147483647<<(int)2147483648U 011…1B(23 —1)>100*…0B(—2*) 


二 1 一 多 His1B(=D) -110B( = 


(unsigned)—1>—2 11…1B (2*—1)>11:…10B(2’ —2) 

8 个 关系 表达 式 运算 结果 分 别 是 1、1、0、1、0、0、1、1, 其 中 1 表示 “ 真 ”,0 表示 “ 假 >。 关 
系 表达 式 “2147483647 二 (int) 2147483648U” 的 结果 为 “ 假 ?”” 因为 小 于 号 右边 的 
“2147483648U” 是 一 个 带 后 缀 U 的 整数 ,因而 是 无 符号 整数 ,其 机 器 数 为 “100…0? 
(1 后 面 跟 31 个 0), 其 值 为 224。 强 制 类 型 转换 为 int 类 型 后 ,其 真 值 为 一 22， 即 
“一 2147483648”, 显然 “2147483647 二 一 2147483648” 是 不 成 立 的 ,也 即 结果 为 “ 假 ”。 

9. 以 下 是 一 个 C 语言 程序 ,用 来 计算 一 个 数组 a 中 每 个 元 素 的 和 。 当 参数 len 为 0 时 ， 
返回 值 应 该 是 0, 但 在 执行 时 , 却 发 生 了 存储 器 访问 异常 。 请 问 这 是 什么 原因 造成 的 ,并 说 
明 程序 应 该 如 何 修改 。 


float sum elements (float a[], unsigned len) 
{ 
int 1} 


float result=0; 


1 
2 
3 
4 
5 
6 for (i=0; i<=len-1; i++) 
7 result+=al[li]; 

8 return result; 

9 


} 


【分 析 和 解答】 

存储 器 访问 异常 是 由 于 对 数组 a 访问 时 产生 了 越界 错误 而 造成 的 。 循 环 变量 i 是 int 
型 ,而 /en 是 unsigned 型 , 当 len 为 0 时 ,执行 ien 一 1 的 结果 为 32 个 1, 是 最 大 可 表示 的 32 
位 无 符号 数 , 任 何 无 符号 数 都 比 它 小 ,使 得 循环 体 被 不 断 执 行 ,导致 数组 访问 越界 ,因而 发 生 
存储 器 访问 异常 。 应 当 将 参数 /en 声明 为 int 型 。 

10. 下 列 几 种 情况 所 能 表示 的 数 的 范围 是 什么 ? 

(1) 16 位 无 符号 整数 

《2) 16 位 原 码 定点 小 数 

《3) 16 位 补 码 定点 小 数 

(4) 16 位 补 码 定点 整数 
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(5) 下 述 格 式 的 浮 点 数 ( 基 数 为 2, 移 码 的 偏 置 常数 为 128, 规 格 化 尾数 ,不 考虑 隐藏 位 》 


数 符 阶 码 尾数 
1 位 8 位 移 码 7 位 原 码 


【分 析 解 答 】 

(1) 16 位 无 符号 整数 范围 为 0 一 2 一 1, 即 0 一 65535 。 

(2) 16 位 原 码 定点 小 数 表示 的 范围 为 一 (1 一 2 35) 一 十 (1 一 2-5) 。 

(3) 16 位 补 码 定点 小 数 表示 的 范围 为 一 1 一 十 (1 一 2 ) 。 

(4) 16 位 补 码 定点 整数 表示 的 范围 为 一 2 一 十 (25 一 1) , 即 一 32768 一 十 32767 。 

(5) 规格 化 浮 点 数 的 表示 范围 如 下 。 

最 大 正 数 : 十 0.1111111BX2813103 一 十 (1 一 2-7) X23127 

最 小 正 数 : 十 0. 1000000BX 2%00 "0 一 十 2-1 X2-128 一 十 2 一 129 

最 大 负数 : 一 0. 1000000BX 2000 oo 一 一 2-1X2-128 一 一 2 一 129 

最 小 负数 : 一 0. 1111111BX23n13322 一 一 (1 一 2-7)7X 2127 

由 于 原 码 是 关于 原点 对 称 的 ,所 以 , 浮 点数 的 表示 范围 是 关于 原点 对 称 的 。 

对 于 非 规 格 化 浮 点 数 ,最 小 正 数 和 最 大 负数 的 尾数 形式 为 土 0. 000 0001B, 因而 值 为 
土 23-7X2-2 一 十 2 下。 

11. 设 某 浮 点 数 格式 为 : 


数 符 阶 码 尾数 
1 位 5 位 移 码 6 位 补 码 
其 中 , 移 码 的 偏 置 常数 为 16, 补 码 采 用 一 位 符号 位 ,基数 为 4, 规格 化 尾数 ,不 考虑 隐 


藏 位 。 
(1) 用 这 种 格式 表示 下 列 十 进 制 数 : 十 1. 625 ,一 0.125 ,十 20, 一 9/16。 
(2) 写 出 该 格式 浮 点 数 的 表示 范围 。 
【分 析 解 答 】 
(1) 十 1.625 一 十 1. 1010B= (十 0. 122)4 XX 出 , 故 阶 码 为 1 十 16 二 17 二 10001B, 尾 数 为 四 
进 制 数 十 0. 122 的 补 码 , 即 0.011010B, 因 此 ,十 1. 625 表示 为 0 10001 011010B。 
0.125 0.0010B 二 (一 0. 200), X47 , 故 阶 码 为 一 1 十 16 二 15 一 01111B, 尾 数 为 四 
进 制 数 一 0. 200 的 补 码 , 即 1. 100000B, 因 此 ,一 0.125 表示 为 1 01111 100000B。 
十 20 王 十 10100B= (十 0. 110), XX 如, 故 阶 码 为 3 十 16 二 19 二 10011B, 尾 数 为 四 进 制 数 
十 0. 110 的 补 码 , 即 0.010100B, 因 此 ,十 20 表示 为 0 10011 010100B。 
9/16 0.1001B==( 一 0. 210), X44, 故 阶 码 为 0 十 16 二 16 二 10000B, 尾 数 为 四 进 制 
数 一 0. 210 的 补 码 ， 即 1. 011100B, 因 此 ,一 9/16 表示 为 1 10000 011100B。 
(2) 规格 化 浮 点 数 的 表示 范围 如 下 。 
最 大 正 数 : 十 0. 111111BX4:+43 二 (十 0. 333) X41 
最 小 正 数 : 十 0. 010000BX4%%%3 二 (十 0. 100), X4 1 一 十 4 2 
最 大 负数 : 一 0. 010000BX4%%%3= 二 (一 0. 100)4X4 = 一 4 
最 小 负数 : 一 1. 000000BX422923=( 一 1. 000), X45 二 一 415 


数据 的 机 器 级 表示 


由 于 补 码 表示 的 尾数 不 是 关于 原点 对 称 的 ,所 以 , 淫 点 数 的 表示 范围 不 是 相对 于 原点 对 
称 的 。 

12. 以 IEEE 754 单 精度 浮 点 数 格式 表示 下 列 十 进 制 数 ,要 求 结果 写成 十 六 进 制 形式 。 

十 1. 625, 一 0.125, 十 20, 一 9/16 

【分 析 解 答 】 

十 1.625 一 十 1.101BX2" ,所 以 ,符号 ;二 0, 阶 码 e 二 0 十 127 二 0111 1111B, 尾 数 的 小 数 
部 分 f==0. 101B, 因 此 ,十 1. 625 用 IEEE 754 单 精 度 浮 点 数 格式 表示 为 0011 1111 1101 
0000 0000 0000 0000 0000B, 用 十 六 进 制 形式 表示 为 3FD0 0000H。 

0.125 0.001B 1.0BX2-* ,所 以 ,符号 ;二 1, 阶 码 e 3 十 127 王 0111 1100B， 
尾数 的 小 数 部 分 f 二 0.0B, 因 此 ,一 0.125 用 IEEE 754 单 精度 浮 点 数 格 式 表 示 为 1011 1110 
0000 0000 0000 0000 0000 0000B, 用 十 六 进 制 形式 表示 为 BE00 0000H。 

十 20 一 十 10100B== 十 1.01BX24 ,所 以 ,符号 ;==0, 阶 码 e=4 十 127 二 1000 0011B， 尾 数 
的 小 数 部 分 F 一 0.01B, 因 此 ,十 20 用 IEEE 754 单 精度 浮 点 数 格式 表示 为 0100 0001 1010 
0000 0000 0000 0000 0000B, 用 十 六 进 制 形式 表示 为 41A0 0000H。 

9/16 0. 1001B== 一 1.001BX2-: ,所 以 ,符号 *=1, 阶 码 e 一 一 1 十 127 一 0111 
1110B, 尾 数 的 小 数 部 分 f==0. 001B, 因此 ,一 9/16 用 IEEE 754 单 精 度 浮 点 数 格式 表示 为 
1011 1111 0001 0000 0000 0000 0000 0000B, 用 十 六 进 制 形式 表示 为 BF10 0000H 。 

13. 假定 一 个 float 型 变量 z 的 机 器 数 为 4510 0000H, 则 变量 xz 的 值 是 多 少 ? 

【分 析 和 解答】 

float 型 变量 的 机 器 数 对 应 IEEE 754 单 精度 淫 点 数 格式 ,因此 ,将 4510 0000H 展开 为 
32 位 机 器 数 : 0100 0101 0001 0000 0000 0000 0000 0000 后 ,得 到 其 符号 为 0; 阶 码 为 1000 
1010B 一 127==11; 尾 数 的 值 为 1.001B=1.125。 因 而 xz 的 数值 为 十 1. 125X2" 二 2304。 

14. 设 一 个 变量 的 值 为 2049 ,要求 分 别 用 32 位 补 码 整数 和 IEEE 754 单 精度 浮 点 格式 
表示 该 变量 (结果 用 十 六 进 制 表示 ) ,并 说 明 哪 段 二 进 制 序列 在 两 种 表示 中 完全 相同 ,为 什么 
会 相同 ? 

【分 析 解 答 】 

2049 王 1000 0000 0001B== 十 1. 000 0000 0001BX 2 ,用 32 位 补 码 整数 表示 为 0000 
0000 0000 0000 0000 1000 0000 0001 ,用 十 六 进 制 形式 表示 为 0000 0801H; 用 IEEE 754 单 
精度 浮 点 数 格式 表示 时 ,符号 * 一 0, 阶 码 e 王 11 十 127 一 10001010B， 尾 数 的 小 数 部 分 
f=0.000 0000 0001B, 因 此 ,2049 用 IEEE 754 单 精 度 浮 点 数 格式 表示 为 0 100 0101 0000 
0000 0001 0000 0000 0000B, 用 十 六 进 制 形式 表示 为 4500 1000H。 

在 上 述 两 种 表示 中 ,存在 相同 的 序列 000 0000 0001。 因 为 2049 被 转换 为 规格 化 浮 点 
数 后 ,有 效 数值 部 分 中 最 前 面 的 1 被 隐藏 ,剩余 部 分 为 000 0000 0001, 而 2049 的 32 位 补 码 
整数 表示 中 保留 了 完整 的 有 效 数 值 部 分 , 即 最 前 面 的 1 没有 被 隐藏 ,所 以 除了 这 个 1 之 外 后 
面 的 二 进 制 序列 000 0000 0001 是 相同 的 。 

15. 设 一 个 变量 的 值 为 一 2147483646 ,要求 分 别 用 32 位 补 码 整数 和 IEEE 754 单 精度 
浮 点 格式 表示 该 变量 (结果 用 十 六 进 制 表示 ) ,并 说 明 哪 种 表示 其 值 完全 精确 , 哪 种 表示 的 是 
近似 值 。 


| 第 
| 2 
章 


计算 机 组 成 与 系统 对 欧 习 题解 答 与 裘 学 持 蛙 


【分 析 和 解答】 

一 2147483646 一 一 111 1111 1111 1111 1111 1111 1111 1110B= 一 1.1111111111 1111 
1111 1111 1111 1110BX 23" ,32 位 补 码 形式 为 1000 0000 0000 0000 0000 0000 0000 0010B 
(8000 0002H) ,IEEE 754 单 精度 格式 为 1100 1110 1111 1111 1111 1111 1111 1111B(CEFF 
FFFFH) ,因为 一 2147483646 在 一 232 一 232 一 1 范围 内 ,所 以 可 用 32 位 补 码 精确 表示 ;对 于 
IEEE 754 单 精度 浮 点 数 格式 ,最 多 只 可 表示 24 位 有 效 二 进位 数字 ,而 一 2147483646 的 有 
效 二 进位 有 30 位 ,后 面 的 有 效 二 进位 必须 截断 ,因而 是 近似 表示 。 

16. 假定 变量 i 和 f 的 数据 类 型 分 别 为 int 和 float, sizeof (int) = 二 4, 已 知 i= 
1234567890,f 二 1. 23456789e10, 要 求 给 出 以 下 各 关系 表达 式 的 结果 ,并 说 明 原 因 。 


(1) i== (int) (float) (2) i== (int) (double)i 
(3) f== (float)(int)f (4) f== (float) (double)f 
【分 析 解 答 】 


《1) 结果 为 “ 假 ”。 因 为 float 类 型 采用 IEEE 754 单 精度 浮 点 数 格式 ,尾数 的 小 数 部 分 
只 有 23 个 二 进位 和 一 位 隐藏 位 ,共有 24 位 有 效 位 数 ,相应 地 ,十 进 制 有 效 位 数 为 7 位 ,而 i 
中 有 9 位 有 效 位 数 , 因 而 将 i 转换 为 float 类 型 时 会 发 生 有 效 数字 的 丢失 ,再 转换 为 int 类 型 
时 ,其 值 已 经 被 改变 了 。 

(2) 结果 为 “ 真 >”。 因 为 double 类 型 采用 IEEE 754 双 精 度 浮 点 数 格式 ,其 有 效 位 数 为 
52 十 1 一 53 个 二 进位 ,而 int 类 型 的 有 效 位 数 有 31 个 二 进位 ,因而 ,对 于 任何 一 个 int 类 型 的 
变量 ,转换 为 double 类 型 数据 后 ,精度 不 会 有 任何 损失 ,再 转换 回 int 类 型 时 ,其 值 不 变 。 

(3) 结果 为 “ 假 >。 因 为 变量 f 的 值 超过 了 int 类 型 可 表示 的 最 大 值 , 因 而 将 f 转换 为 
int 类 型 后 再 转换 回 float 类 型 时 ,其 值 已 经 改变 。 

(4) 结果 是 “ 真 >。 因 为 double 类 型 的 精度 比 float 类 型 高 ,任何 float 类 型 变量 的 值 转 
换 为 double 后 再 转换 回 float 类 型 时 ,其 值 不 变 。 

17. 假定 某 32 位 字 长 的 机 器 中 带 符号 整数 用 补 码 表示 , 浮 点 数 用 IEEE 754 标准 表示 ， 
寄存 器 R1 和 R2 的 内 容 分 别 为 8020 0000H 和 0080 0000H。 若 执行 下 列 运算 指令 时 ,操作 
数 为 寄存 器 R1 和 R2 的 内 容 , 则 R1 和 R2 中 操作 数 的 真 值 分 别 为 多 少 ? 

(1) 无 符号 数 加 法 指令 

〈2) 带 符号 整数 乘法 指令 

〈3) 单 精 度 浮 点 数 减 法 指令 

【分 析 解 答 】 

不 同 指 令 对 寄存 器 内 容 进 行 不 同 的 操作 ,因而 ,不 同 指令 执行 时 寄存 器 内 容 对 应 的 真 值 
不 同 。 

(1) 对 于 无 符号 数 加 法 指令 ,R1 和 R2 的 内 容 均 被 解释 成 无 符号 整数 , 即 R1 的 真 值 为 
8020 0000H，R2 的 真 值 为 80 0000H ,也 即 R1 的 真 值 为 21 十 22 ,R2 的 真 值 为 22 。 

(2) 对 于 带 符号 整数 乘法 指令 ,Rl 和 R2 的 内 容 均 被 解释 为 补 码 整 数 , 由 最 高 位 可 知 ， 
RI1 为 负数 , R2 为 正 数 。R1 的 真 值 为 一 0111 1111 1110 0000 0000 0000 0000 0000B, 即 
一 7FE0 0000H;R2 的 真 值 为 十 80 0000H ,也 即 R1 的 真 值 为 一 (23 一 22),R2 的 真 值 为 22 。 

《3) 对 于 单 精 度 浮 点 数 减法 指令 ,R1 和 R2 的 内 容 均 为 IEEE 754 单 精度 淫 点 数 。 由 
Rl 的 内 容 可 知 ,其 符号 位 为 1, 表示 负数 , 阶 码 为 0000 0000B, 尾数 部 分 为 010 0000 0000 
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0000 0000 0000B, 因为 阶 码 为 全 0, 尾 数 为 非 0 数 , 故 Rl 是 非 规 格 化 浮 点 数 , 其 指数 为 
一 126, 尾 数 为 0.01B, 故 R1 表示 的 真 值 为 一 0.01BX2-1# 一 一 2-128 。 由 有 2 的 内 容 可 知 , 其 
符号 位 为 0, 表 示 正 数 , 阶 码 为 0000 0001B, 尾 数 部 分 为 000 0000 0000 0000 0000 0000B,R1 
为 规格 化 浮 点 数 ,其 指数 为 1 一 127= 一 126 ,尾数 为 1. 0B, 故 R2 表示 的 真 值 为 十 1. 0B xX 
2-126 一 2-126 。 

18. IBM 370 的 短 浮 点 数 格式 中 ,总 位 数 为 32 位 ,左边 第 一 位 (Bb) 为 数 符 ,随后 7 位 
(b1 一 bi ) 为 阶 码 ,用 移 码 表示 , 偏 置 常 数 为 64 ,右边 24 位 (Bs~bs) 为 6 位 十 六 进 制 原 码 小 数 
表示 的 尾数 ,采用 规格 化 形式 , 基 为 16。 若 将 十 进 制 数 一 260. 125 用 该 浮 点 数 格式 表示 , 则 
对 应 的 机 器 数 是 什么 ?要 求 用 十 六 进 制 形式 表示 )》 

【分 析 和 解答】 

IBM 370 的 短 浮 点 数 格式 的 尾数 采用 十 六 进 制 原 码 表示 ,基数 是 16。 因 此 ,在 进行 数据 
转换 时 ,要 先 转化 成 十 六 进 制 形式 。 即 一 260. 125 王 一 0001 0000 0100. 0010B= (一 104. 2)1s 一 
〈 一 0. 1042)is X16 。 由 此 可 知 , 浮 点 数 符号 位 应 为 1, 指数 为 3, 用 7 位 移 码 表示 为 64 十 3 一 
100 0011B, 故 前 8 位 表示 为 1 100 0011B, 对 应 的 十 六 进 制 为 C3H ,尾数 部 分 的 6 位 十 六 进 
制 数 为 10 4200H, 因 此 ,对 应 的 机 器 数 为 C310 4200H。 

19. 1991 年 2 月 25 日 ,海湾 战争 中 ,美国 在 沙特 阿拉 伯 的 达 摩 地 区 设置 的 爱国 者 导弹 
拦截 伊拉克 的 飞毛腿 导弹 失败 ,致使 飞毛腿 导弹 击 中 了 美国 的 一 个 兵营 ,造成 了 28 名 士兵 
死亡 。 拦 截 失败 的 原因 是 由 于 一 个 浮 点 数 的 精度 问题 造成 的 。 爱 国 者 导弹 系统 中 有 一 个 内 
置 时钟 , 用 计数 器 实现 ,每 隔 0. 1 秒 计数 一 次 。 程 序 用 0. 1 乘 以 计数 器 的 值得 到 以 秒 为 单位 
的 时 间 。0. 1 的 二 进 制 表示 是 一 个 无 限 循环 序列 : 0. 00011[0011]B( 方 括号 中 的 序列 是 重 
复 的 )。 请 问 : 

(1) 假定 用 一 个 类 型 为 float 的 变量 z 来 表示 0. 1, 则 变量 z 在 机 器 中 的 机 器 数 是 什么 
(要 求 写成 十 六 进 制 形式 )? 绝对 值 |x 一 0.1| 的 值 是 什么 (要 求 用 十 进 制 表 示 )? 

《2) 爱国 者 系统 启动 时 计数 器 的 初始 值 为 0, 并 开始 持续 计数 。 假 定 当 时 系统 运行 了 
200 个 小 时 , 则 程序 计算 的 时 间 和 实际 时 间 的 偏差 为 多 少 ? 如 果 爱 国 者 根据 飞毛腿 的 速度 乘 
以 它 被 侦 测 到 的 时 间 来 预测 位 置 , 若 飞毛腿 的 速度 为 2000 米 / 秒 , 则 预测 偏差 的 距离 为 多 少 ? 

【分 析 解 答 】 

(1) 0.1==0.0 0011[0011]B= 十 1. 1 0011 0011 0011 0011 0011 00BX2-,float 类 型 采 
用 IEEE 754 单 精 度 浮 点 数 格式 。 符 号 位 * 为 0, 阶 码 e= 二 127 一 4 二 123 二 0111 1011B, 尾数 
的 小 数 部 分 为 0. 1001 1001 1001 1001 1001 100B, 因 此 ,在 机 器 中 float 型 变量 x 表示 为 
0 011 1101 1 100 1100 1100 1100 1100 1100B, 用 十 六 进 制 形 式 表示 为 3DCC CCCCH。 由 
于 float 类 型 的 精度 有 限 , 只 有 24 位 有 效 位 数 ,尾数 从 最 前 面 的 1 开始 一 共 只 能 表示 24 位 ， 
后 面 的 有 效 数字 全 部 被 截断 , 故 z 与 0. 1 之 间 的 误差 为 |x 一 0. 1| 二 0. 000 0000 0000 0000 
0000 0000 0000 1100 [1100]B。 这 个 值 约 等 于 0. 11BX2-2” ,大 约 为 5. 59X10-? 。 

(2) 爱国 者 系统 运行 200 个 小 时 后 ,共计 数 200X60X60X10=72X105 次 。 因 此 , 程 
序 计算 的 时 间 和 实际 时 间 的 偏差 约 为 5. 59X10-，X72X105 一 0.0402s。 预 测 偏 差距 离 约 为 
2000m/sX0.0402s=80. 4m。 

20. 假定 浮 点 数 的 阶 码 用 m 位 移 码 表示 , 偏 置 常数 为 2”! 一 1, 规 格 化 尾数 的 整数 部 分 
为 1, 是 隐藏 位 ,小 数 部 分 有 位 ,用 原 码 表示 , 基 为 2, 请 回答 下 列 问题 。 
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(1) 能 用 这 种 浮 点 数 格式 精确 表示 的 最 小 正 整数 是 多 少 ? 

〈2) 不 能 用 这 种 浮 点 数 格式 精确 表示 的 最 小 正 整数 是 多 少 ? 

【分 析 解 答 】 

(1) 能 用 这 种 浮 点 数 格式 表示 的 最 小 正 整数 为 1。 

〈2) 这 种 浮 点 数 格式 的 有 效 位 数 为 n 十 1 位 ,因此 , 当 某 个 正 整数 的 有 效 位 数 大 于 2 十 1 
位 时 , 则 ”十 1 位 后 的 有 效 数 字 被 截断 ,也 即 不 能 用 这 种 浮 点 数 格式 精确 表示 。 因 此 ,不 能 用 
这 种 浮 点 数 格式 表示 的 最 小 正 整 数 为 十 10…01B( 中 间 有 ?位 0) ,其 值 为 2”! 十 1。 

21, 图 2. 1(a) 是 某 个 C++ 程序 ,图 2. 1(b) 是 该 程序 的 若干 组 执行 结果 。 请 根据 IEEE 
754 标准 的 伟人 规定 对 执行 结果 进行 解释 说 明 ,并 通过 分 析 得 出 float 变量 的 有 效 位 数 。 


#include <iostream> Please enter a nmber: 61.419997 
using namespace std; 61.419998 
int main() Please enter a numoer: 61.419998 
{ 61.419998 
float heads; Please enter a number: 61.419999 
cout .setf(ios::fixed,ios::floatfield)7 61.419998 
while(1) Please enter a number: 61.42 
{ 61.419998 
cout<<"please enter a number:"; Please enter a numoer: 61.420001 
cin>>heads; 61.420002 
cout<<heads<<endl; Please enter a numper: 
} 
return 0; 
} 
(a) C++ 源 程序 (b) 程序 运行 结果 


图 2.1 源 程序 及 其 运行 结果 示例 


【分 析 解 答 】 

该 程序 的 功能 非常 简单 ,就 是 从 键盘 输入 一 个 实数 , 赋 给 一 个 float 型 变量 后 再 从 屏幕 
上 输出 。 从 运行 结果 来 看 , 61. 419998 和 61. 420002 是 两 个 可 表示 数 ,两 者 之 间 相 差 
0. 000004。 当 输入 数据 是 一 个 不 可 表示 数 时 ,机 器 将 其 转换 为 最 邻近 的 可 表示 数 。 

目前 几乎 所 有 机 器 中 float 型 变量 都 是 采用 IEEE 754 单 精 度 浮 点 数 格式 表示 ,其 二 进 
制 有 效 位 数 为 24 位 ,因此 相应 的 十 进 制 有 效 位 数 为 7 位 。 因 为 61=111101B=1.11101BxX 
25 ,如果 将 float 型 数据 的 规格 化 正 数 的 表示 范围 以 2 关 ( 一 126 委 i 生 127) 为 分 割 点 划分 成 若 
干 区 间 , 61. 419998 应 该 位 于 区 间 [2 ,2*], 该 区 间 相 邻 可 表示 数 之 间 的 间隔 为 2 2 义 
25 一 2 2 一 0.0000038…<0.000004, 从 上 述 分 析 结 果 来 看 ,该 区 间 相 邻 两 个 可 表示 数 之 间 
的 间隔 就 是 0.000004。 因 此 ,在 61. 419998 前 面 的 可 表示 数 为 61. 419994, 后 面 的 可 表示 数 
为 61.420002。 

显然 , 当 输 入 61. 419997 和 61. 419999 时 ,其 最 靠近 的 可 表示 数 为 61. 419998; 而 
61. 420001 的 最 邻近 可 表示 数 为 61. 420002; 当 输入 为 61. 42 时 ,从 十 进 制 形式 61. 42000 来 
看 , 它 位 于 可 表示 数 61. 419998 和 61. 420002 的 中 点 ,但 是 ,实际 上 机 器 内 部 是 按照 二 进 制 
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表示 来 判断 的 ,从 二 进 制 表示 形式 来 看 ,61. 42 应 该 更 靠近 61. 419998, 因 此 ,61. 42 对 应 输 
出 的 可 表示 数 为 61. 419998。 

22. 假定 在 一 个 程序 中 定义 了 变量 xz、y 和 i, 其 中 ,x 和 y 是 float 型 变量 (用 IEEE 754 单 
精度 浮 点 数 表示 ),i 是 16 位 short 型 变量 (用 补 码 表示 )。 程 序 执行 到 某 一 时 刻 ,z 王 一 130、 
2 一 7.25; 一 130, 它 们 都 被 写 到 了 主 存 ( 按 字 节 编 址 ) 中 ,其 地 址 分 别 是 &zx,&&y 和 &&i。 请 
分 别 给 出 在 大 端 机 器 和 小 端 机 器 上 变量 z、y 和 i 在 内 存 的 存放 位 置 。 

【分 析 解 答 】 

ZX 二 一 130 二 一 10000010B== 一 1.000001BX27 , 阶 码 e 一 127 十 7 一 128 十 6 一 1000 0110B， 
所 以 ,用 IEEE 754 单 精度 浮 点 数 表示 为 1100 0011 0000 0010 0000 0000 0000 0000B= 
C302 0000H。 

y 一 7.25 一 111. 01B 一 十 1. 1101BX 22: , 阶 码 e 王 127 十 2 一 128 十 1 一 1000 0001B, 所 以 ,用 
IEEE 754 单 精度 浮 点 数 表 示 为 0100 0000 1110 1000 0000 0000 0000 0000B==40E8 0000H。 

i 一 130 王 1000 0010B, 用 16 位 补 码 表示 为 0082H。 

上 述 3 个 数据 在 大 端 机 器 和 小 端 机 器 上 的 存放 位 置 如 表 2. 5 所 示 。 


表 2.5 数据 在 大 端 机 器 和 小 端 机 器 中 的 存放 位 置 
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地 址 大 端 机 器 小 端 机 器 
Bx C3H 00H 
&z 二 1 02H 00H 
&z 十 2 00H 02H 
&z 十 3 00H C3H 
By 40H 00H 
&y 二 1 E8H 00H 
&y 二 2 00H E8H 
& ay 十 3 00H 40H 
Ri 00H 82H 
&it+1 82H 00H 


23. 假定 某 计算 机 存储 器 按 字 节 编 址 ,CPU 从 存储 器 中 读 出 一 个 4 字 节 信息 D=3234 
3538H ,该 信息 的 内 存 地 址 为 0000 F00CH, 按 小 端 方式 存放 ,请 回答 下 列 问 题 。 

(1) 该 信息 D 占用 了 几 个 内 存单 元 ? 这 几 个 内 存单 元 的 地 址 及 其 内 容 各 是 什么 ? 

(2) 车 了 是 一 个 32 位 无 符号 数 , 则 其 值 是 多 少 ? 

(3) 车 DD 是 一 个 32 位 补 码 表示 的 带 符号 整数 , 则 其 值 是 多 少 ? 

(4) 车 也 是 一 个 IEEE 754 单 精度 浮 点 数 , 则 其 值 是 多 少 ? 

(5) 若 D 是 一 个 用 8421 码 表示 的 无 符号 整数 , 则 其 值 是 多 少 ? 

(6) 若 D 是 一 个 字符 串 ,每 个 字 节 的 低 7 位 表示 对 应 字符 的 ASCII 码 , 则 对 应 字符 串 是 
什么 ? 
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(7) 若 D 是 两 个 汉字 的 国标 码 , 则 这 两 个 汉字 在 GB 2312 字符 集 码 表 中 分 别 位 于 哪 一 
行 和 哪 一 列 ? 

(8) 若 D 中 前 3 个 字 节 分 别 是 一 个 像素 的 RG、B 分量 的 颜色 值 , 则 其 值 各 是 多 少 ? 

【分 析 解 答 】 

将 3234 3538H 展开 为 二 进 制 表 示 为 0011 0010 0011 0100 0011 0101 0011 1000B。 

(1) 因为 存储 器 按 字 节 编 址 ,所 以 4 个 字 节 占用 4 个 内 存单 元 ,其 地 址 分 别 是 0000 
FO0CH、0000 F00DH 、0000 FO00EH、0000 F00FH。 由 于 采用 小 端 方式 存放 ,所 以 ,最 低 有 效 
字 节 38H 存放 在 0000 F00CH 中 ,35H 存放 在 0000 FOODH 中 ,34H 存放 在 0000 FO00EH 
中 ,32H 存放 在 0000 FOOFH 中 。 

《2) 无 符号 数 : 其 值 为 22 十 22 十 25 十 23 十 22 十 2 十 2 十 22 十 2 十 28 十 25 十 24 十 23 。 

(3) 补 码 整数 : 符号 为 0, 表 示 其 为 正 数 ,其 值 为 与 无 符号 数 的 值 一样 。 

(4) IEEE 754 单 精 度 浮 点 数 : 根据 IEEE 754 单 精度 浮 点 数 格式 可 知 ,符号 位 ;二 0, 为 
正 数 ; 阶 码 e 二 0110 0100B 王 100 , 值 为 100 一 127 王 一 27; 尾 数 小 数 部 分 f= 二 0. 011 0100 0011 
0101 0011 1000B, 所 以 ,其 值 为 1.011 0100 0011 0101 0011 1BX2-2” 。 

(5) 8421 码 整数 : 表示 对 应 十 进 制 数 32343538 。 

(6) ASCII 码 字符 串 : 各 字 节 的 低 7 位 分 别 为 011 0010B、011 0100B、011 0101B、011 
1000B ,所 以 ,对 应 的 字符 串 为 “2458”。 

(7) 汉字 : 对 国标 码 每 个 字 节 各 自 减 20H, 得 到 两 个 汉字 的 区 位 码 分 别 为 1214H 和 
1518H, 即 ,第 一 个 汉字 在 GB 2312 字符 集 码 表 中 位 于 第 18(12H) 行 .第 20(14H) 列 ,第 二 
个 汉字 位 于 第 21(15H) 行 .第 24(18H) 列 。 

(8) 颜色 值 : R、G、B 分 量 的 颜色 值 分 别 为 0011 0010B = 50, 0011 0100B = 52， 
0011 0101B 一 53。 

24. 已 知 下 列 字 符 编码 : A 二 100 0001B,a=110 0001B,0=011 0000B, 求 Dd.6 的 7 
位 ACSII 码 和 第 一 位 前 加 入 奇 校 验 位 后 的 8 位 编码 。 

【分 析 解 答 】 

D 的 ASCII 码 为 100 0001B 十 011B = 100 0100B, 前 面 加 奇 校 验 位 后 的 编码 是 
1 100 0100B。 

d 的 ASCII 码 为 110 0001B 十 011B = 110 0100B, 前面 加 奇 校 验 位 后 的 编码 是 
0 110 0100B。 

6 的 ASCII 码 为 011 0000B 十 110B= 011 0110B, 前面 加 奇 校 验 位 后 的 编码 是 
1 011 0110B。 

25. 某 数据 为 0110 0101B, 采 用 奇 校 验 和 CRC 校 验 (生成 多 项 式 为 x! 十 x 十 1) 对 应 的 
校 验 码 各 是 什么 ? 

【分 析 解 答 】 

采用 奇 校 验 时 ,因为 数据 中 有 偶数 个 1, 故 校 验 位 为 1; 采 用 CRC 校 验 时 ,生成 多 项 式 为 
Xx* 十 x 十 1, 故 有 4 个 校 验 位 。 首 先 在 数据 后 面 添 4 个 0, 得 到 0110 0101 0000B, 再 将 它 和 
10011 进行 模 2 除法 ,得 到 余数 为 0010B, 所 以 校 验 码 为 0010B。 
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26. 假定 某 计算 机 的 总 线 采 用 偶 校 验 , 每 8 位 数据 有 一 位 校 验 位 ,车 在 32 位 数据 线 上 
传输 的 信息 为 1234 5678H , 则 对 应 的 4 个 校 验 位 应 为 什么 ? 车 接收 方 收 到 的 数据 信息 和 校 
验 位 分 别 为 1235 5678H 和 0100B, 则 说 明 发 生 了 什么 情况 ,给 出 验证 过 程 。 

【分 析 解 答 】 

总 线 上 传输 的 4 个 字 节 分 别 为 0001 0010B,0011 0100B,0101 0110B,0111 1000B, 因 此 
对 应 的 4 个 偶 校 验 位 P, 一 P;, 分 别 为 0,1,0,0。 当 接收 方 收 到 数据 信息 1235 5678H 和 校 验 
位 0100B 后 ,进行 如 下 验证 。 

第 1 字 节 : 数据 为 12H 一 0001 0010B, 故 校 验 位 Po 二 0,0 旬 0 二 0, 说 明 传 输 正确 。 

第 2 字 节 : 数据 为 35H 二 0011 0101B, 故 校 验 位 Pi 二 0,0 田 1=1, 说 明 传 输 错误 。 

第 3 字 节 : 数据 为 55H 王 0101 0110B, 故 校 验 位 P: =0,0@0=0, 说 明 传输 正确 。 

第 4 字 节 : 数据 为 78 卫 二 0111 1000B, 故 校 验 位 Ps 一 0,0 引 0=0, 说 明 传输 正确 。 

27. 假定 一 个 16 位 数据 Mie Mis Mu Mis Mis Mi MoM MeM Ms M; MMsM;M 为 0111 
1000 1101 0010B, 要 求 写 出 16 位 数据 的 SEC 码 ,并 说 明 SEC 码 如 何 正确 检测 数据 位 Ms 的 
错误 。 

【分 析 解 答 】 

对 于 16 位 数据 的 单 检 错 码 , 其 校 验 位 P 和 故障 字 S 都 是 5 位。 假定 故障 字 $= 
Ss'S4sSsSsS, 的 值 反映 对 应 数据 位 或 校 验 位 出 错 , 则 得 到 码 字 排 列 和 故障 字 的 取 值 如 下 。 

Me M's Mu Ms Mi Ps Mi Mo M, Ms Mr Ms Ms Pi M M; M:; Ps RM P, 也, 


Ss 1 1 1 1 11000000000.00.0.0 .000 
Se 0 0 Or 0 0 OL TL 1 1 0 0 0 00 C0 
Ss 1 10 0. 0 0 4, 1 1 1 0 0 0 0 1 1 1 0070 
S00 1 0 0 1 1 .0 0 1 .00 1 10 .0 1 10 
sil 0 01 0 1 0 1 0 0 10 1 0 0 1 0 


根据 上 表 , 得 到 各 个 校 验 位 的 计算 公式 如 下 : 
也 一 AM DOM, 中 Ms DBM, OOM; OOM: DOM, OM DM OM, DM 
P:=M.OMOM. DMOMODM OMIOMODM, 
P;=M,DM, ODM, DM DM,DM DMOM DM 
Pi=M; DBM DM DM OM DM DM 
P;=M:DM ODM, DM DM 
当 数 据 字 为 0111 1000 1101 0010B 时 , 代 人 上 述 公式 ,得 到 校 验 位 P= Ps P Ps P; P= 
00011B。 第 5 位 数据 Ms 出 错 ,数据 字 变 为 0111 1000 1100 0010B, 代 入 上 述 公式 得 到 P= 
Pi PiP;PsPi 一 01010B, 因 而 ,故障 字 S= SsS,S;S;S, 一 00011BB01010B 二 01001B, 说 明码 
字 中 第 9 位 CM) 出 错 。 
28. 假设 要 传送 的 数据 信息 为 111 0001B, 若 约定 的 生成 多 项 式 为 G(x) 二 zx 十 1, 则 校 
验 码 为 多 少 ? 假定 在 接收 端 接收 到 的 数据 信息 为 111 0011B, 说 明 如 何 正确 检测 其 错误 , 写 
出 检测 过 程 。 
【分 析 解 答 】 
原 数据 信息 为 111 0001B, 对 应 的 报 文 多 项 式 为 M(x) 一 xz 十 十 x' 十 1, 因 为 生成 多 项 
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式 的 位 数 为 4 位 ,所 以 校 验 码 的 位 数 为 3 位。 在 原 数 据 信息 后 面 添加 3 个 0, 得 到 M'(z) 一 
ZIM(z) 二 十 zs 十 Z' 十 如 ,用 M (z) 去 模 2 除 G(xz) ,得 到 余数 110B, 因 此 ,在 发 送 端 要 传 
送 的 CRC 码 为 111 0001 110B。 假 定 CRC 码 中 的 校 验 位 在 传送 过 程 中 没有 出 错 , 在 接收 端 
还 是 110B, 在 接收 端 收 到 的 数据 位 为 111 0011B, 则 在 接收 端 对 数据 校 验 时 ,将 接收 端的 
CRC 码 111 0011 110B 用 生成 多 项 式 G(xzx) 进 行 模 2 除 ,得 到 的 余数 为 010B。 余 数 不 为 0 
表明 传输 时 发 生 了 错误 。 


人 
运算 方法 和 运算 部 件 


3.1 教学 目标 和 内 容 安排 


主要 教学 目标 : 

使 学 生 掌握 核心 运算 部 件 ALU 以 及 计算 机 内 部 各 种 基本 运算 算法 和 运算 部 件 的 相关 
知识 ,能 够 运用 所 学 知识 分 析 和 解释 高 级 语言 和 机 器 级 语言 程序 设计 中 遇 到 的 各 种 问题 和 
相应 的 执行 结果 。 

基本 学 习 要 求 : 

(1) 了 解 高 级 程序 设计 语言 和 低级 程序 设计 语言 中 涉及 的 各 种 运算 。 

(2) 掌握 定点 数 的 逻辑 移 位 、 算 术 移 位 和 扩展 操作 方法 。 

(3) 了 解 原 码 加 减 运算 的 基本 原理 。 

(4) 掌握 补 码 加 减 运算 方法 ,并 能 设计 补 码 加 减 运算 器 。 

(5) 了 解 定点 数 乘法 和 除法 运算 的 基本 思想 。 

(6) 了 解 专用 的 阵列 乘法 器 和 阵列 除法 器 的 基本 思想 。 

(7) 理解 为 何在 运算 中 会 发 生 溢出 ,并 掌握 各 类 定点 数 运 算 的 溢出 判断 方法 。 

(8) 掌 拍 浮 点 数 加 减 运算 的 过 程 和 方法 。 

(9) 理解 IEEE 754 标准 对 附加 位 的 添加 以 及 会 入 模式 等 方面 的 规定 。 

《10) 了 解 浮 点 数 乘法 和 除法 运算 的 基本 思想 。 

(11) 掌握 算术 逻辑 单元 ALU 的 功能 和 结构 。 

(12) 了 解囊 行 加 法 器 和 快速 并 行 加 法 器 的 基本 工作 原理 。 

(13) 了 解 定点 运算 器 ( 即 定 点 运算 数据 通路 ) 的 基本 结构 。 

(14) 了 解 浮 点 数 加 减 运算 器 的 基本 结构 。 


本 章 涉 及 各 种 类 型 数据 的 各 种 运算 算法 和 运算 电路 ,因此 内 容 多 而 烦琐 。 特别 是 原 码 
加 减 运算 和 各 种 类 型 的 乘除 运算 ,它们 的 基本 原理 都 很 简单 ,但 实现 起 来 非常 复杂 。 在 课堂 
教学 中 ,这 些 内 容 往 往 占用 很 多 课时 ,而 且 烦 琐 的 步骤 和 一 些 算法 规定 也 经 常 使 学 生 感 觉 枯 
燥 无 味 。 这 些 内 容 在 本 课程 内 容 框 架 体 系 中 ,不 属于 主干 内 容 , 对 这 些 内 容 掌握 得 好 坏 与 深 
浅 程 度 基本 不 会 影响 学 生 对 其 他 知识 的 学 习 。 因 此 ,对 于 原 码 加 减 运算 ,只 要 根据 现实 世界 
中 十 进 制 加 减 运算 规则 去 理解 ,把 原理 讲 清楚 就 行 了 ,没有 必要 让 学 生死 记 硬 背 运 算 规 则 ， 
对 于 乘法 运算 ,只 要 将 原 码 一 位 乘法 和 补 码 一 位 乘法 ( 布 斯 乘法 ) 的 基本 原理 \ 两 位 一 乘 算法 
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的 基本 思想 ,以 及 阵列 乘法 器 的 基本 思想 讲 清楚 就 行 了 。 对 于 除法 运算 ,只 要 将 原 码 除法 运 
算 的 基本 原理 , 补 码 除法 运算 的 特点 ,以 及 阵列 除法 器 的 基本 思想 讲 清楚 就 行 了 。 对 于 乘除 
运算 的 学 习 , 其 主要 目的 不 是 学 会 怎样 模拟 计算 机 进行 乘除 运算 ,而 是 能 够 认识 到 乘除 运算 
的 算法 复杂 性 和 相对 较 大 的 时 间 开 销 ,并 且 认 识 到 不 同 实 现 方法 所 用 时 间 开 销 是 不 同 的 ,这 
种 不 同 主要 是 由 于 运算 部 件 控 制 方式 的 不 同 而 造成 的 。 

课时 有 限 的 情况 下 ,有 关 原 码 加 减 运算 两 位 乘法 运算 、 补 码 除法 运算 、 阵 列 乘 法 器 、 阵 
列 除法 器 、 浮 点 数 乘除 运算 .定点 运算 部 件 、. 浮 点 运算 部 件 等 加 * ?的 部 分 ,都 可 以 只 用 一 两 
句 话 概括 讲 一 下 基本 思想 或 提出 问题 以 引起 学 生 进一步 思考 并 留 作 课 后 阅读 ,无 须 占用 大 
量 的 课堂 时 间 来 介绍 细节 内 容 。 

为 了 增强 学 生 对 计算 机 内 部 各 类 运算 算法 的 认识 ,可 以 让 学 生 亲 自 编写 相关 的 程序 , 通 
过 程序 的 执行 结果 来 理解 本 章 所 学 的 知识 。 与 本 章 内 容 相关 的 编程 练习 示例 如 下 。(1) 给 
定 一 组 无 符号 数 和 有 符号 整数 变量 的 值 , 对 其 进行 移 位 操作 后 ,查看 其 结果 ,并 进行 分 析 解 
释 ; (2) 对 于 某 个 负数 ,如 一 4098, 将 该 数 赋值 给 一 个 short 类 型 变量 ,然后 将 其 转换 为 
unsigned short、int、unsigned int float 等 类 型 ,查看 其 结果 ,并 进行 分 析 解 释 ;(3) 对 于 某 个 
大 的 正 整 数 , 如 2147483647(23 一 1) ,将 该 数 赋值 给 某 个 int 类 型 变量 ,再 将 其 转换 为 short、 
unsigned short、unsigned int、float 等 类 型 ,查看 其 结果 ,并 进行 分 析 解 释 ;(4) 对 于 某 个 十 
进 制 有 效 位 数 多 于 8 的 实数 ,如 123456. 789e5, 将 其 定义 为 float 型 变量 ,然后 转换 为 
double 型 变量 ;再 反 过 来 将 double 型 转换 为 float 型 ,查看 其 结果 ,并 进行 分 析 解 释 ;(5) 对 
于 各 类 运算 ,给 出 一 些 特殊 的 例子 ,以 进行 < 溢出"“ 大 数 吃 小 数 ?等 方面 的 验证 ,并 分 析 结 果 
以 给 出 合理 的 解释 。 例 如 ,对 于 无 符号 数 ( 如 unsigned int), 计算 “1 十 4294967295”、 
“1 一 4294967295” 的 值 . 对 于 带 符号 整数 (如 int) ,计算 “2147483647 十 1”、“ 一 2147483648 一 
1” 的 值 。 对 于 浮 点 数 ,分 别 计算 “(1. 0 十 123456. 789e30) 十 (一 123456. 789e30)” 和 “1. 0 十 
(123456. 789e30 十 (一 123456. 789e30))” 的 值 , 并 查看 两 个 结果 是 否 一 致 ,等 等 。 


3.2 主要 内 容 提要 


1. 加 法 器 

根据 进位 方式 的 不 同 , 有 3 种 基本 加 法 器 : 行 波 进 位 加 法 器 、 进 位 选择 加 法 器 和 先行 
〈 超 前 ?进位 加 法 器 。 行 波 进 位 加 法 器 将 多 个 一 位 全 加 器 串 行 连接 ,各 进位 串 行 传递 ,速度 
慢 ;* 进 位 选择 加 法 器 通过 选择 两 个 分 别 带 进位 0 和 1 的 高 位 部 分 加 法 器 的 输出 来 实现 高 、 低 
两 部 分 的 并 行 执行 ,使 运算 时 间 减 半 ;先行 ( 超 前 ?进位 加 法 器 通过 “进位 生成 ?和 “进位 传递 ” 
函数 来 使 各 进位 独立 、 并 行 产生 ,速度 快 。 可 用 单 级 、 两 级 或 更 多 级 先行 进位 方式 连接 。 采 
用 先行 进位 方式 能 加 快 加 法 器 速度 ,目前 多 用 这 种 方式 。 

2. 算术 多 辑 单 元 (ALU) 

在 先行 进位 加 法 器 的 基础 上 增加 其 他 逻辑 可 构成 ALU, 以 实现 基本 的 加 / 减 算术 运算 
和 基本 逻辑 运算 。ALU 的 输入 有 : 两 个 操作 数 、 一 位 低位 来 的 进位 、 一 组 操作 控制 信号 ， 
ALU 的 输出 有 : 一 个 结果 、 一 位 向 高 位 的 进位 ,以 及 零 标 志 (ZF) 和 溢出 标志 (OF) 等 。 

3. 定点 运算 及 定点 运算 器 

定点 运算 由 专门 的 定点 运算 器 实现 ,其 核心 部 件 是 带 先 行进 位 加 法 器 的 ALU, 在 控制 
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催 辑 的 控制 下 ,可 进行 各 种 座 辑 运算 和 算术 运算 。 除 基本 的 与 或 非 等 逻辑 运算 外 ,主要 的 运 
算 包括 以 下 几 种 。 

(1) 移 位 运算 : 包括 逻辑 移 位 算术 移 位 和 循环 移 位 。 逻 辑 移 位 对 无 符号 数 进行 , 移 位 
时 ,在 空 出 的 位 补 0, 左 移 时 可 根据 移出 位 是 否 为 1 来 判断 溢出 ;算术 移 位 对 带 符号 整数 进 
行 , 移 位 前 后 符号 位 保持 不 变 ,否则 溢出 ;循环 移 位 时 不 需要 考虑 溢出 。 左 移 一 位 ,数值 扩大 
一 倍 , 相 当 于 乘 2 操作 ; 右 移 一 位 ,数值 缩小 一 半 , 相 当 于 除 2 操作 。 

(2) 扩展 运算 : 包括 零 扩展 和 符号 扩展 。 零 扩展 对 无 符号 数 进行 ,高 位 补 0; 符 号 扩展 
对 带 符号 整数 进行 ,因为 用 补 码 表示 ,所 以 在 高 位 直接 补 符号 。 

〈3) 加 减 运算 : 包括 补 码 加 减 \ 原 码 加 减 和 移 码 加 减 运算 。 补 码 加 减 运算 用 于 带 符号 
整数 ,符号 位 和 数值 位 一 起 运算 。 同 号 相 加 时 , 若 结果 的 符号 不 同 于 加 数 的 符号 , 则 会 发 生 
溢出 ;因为 IEEE 754 标准 用 原 码 小 数 表示 尾数 ,所 以 原 码 加 减 运算 用 于 浮 点 数 的 尾数 , 符 
号 位 和 数值 位 分 开 运算 , 同 号 数 相 加 或 异 号 数 相 减 时 ,做 加 法 , 同 号 数 相 减 或 异 号 数 相 加 时 ， 
做 减法 ;因为 IEEE 754 标准 用 移 码 表示 指数 ,所 以 移 码 加 减 运算 用 于 浮 点 数 的 指数 , 移 码 
的 和 、 差 等 于 和 、 差 的 补 码 , 因 此 ,可 通过 移 码 先 求 出 和 、 差 的 补 码 , 最 后 将 符号 取 反 ,就 能 得 
到 和 、 差 的 移 码 表示 。 减 法 运算 电路 只 要 在 加 法 器 基础 上 增加 求 补 和 洲 出 判断 电路 ,并 将 进 
位 输入 端 用 于 加 减 控制 就 可 实现 ,因此 ,所 有 的 减法 运算 都 是 用 加 法 器 实现 的 。 

(4) 乘法 运算 : 包括 无 符号 数 乘 法 、 补 码 乘法 和 原 码 乘 法 ,都 可 用 加 减 及 右 移 运算 实 
现 。 无 符号 数 乘法 用 于 无 符号 整数 ; 补 码 乘法 用 于 带 符号 整数 ,符号 位 和 数值 位 一 起 运算 ， 
可 采用 Booth 算法 或 MBA 算法 ; 原 码 乘法 用 于 浮 点 数 尾数 ,符号 位 和 数值 位 分 开 运算 , 数 
值 部 分 用 无 符号 数 乘法 实现 。 除 了 可 以 在 定点 运算 部 件 中 用 加 法 和 右 移 来 实现 乘法 运算 以 
外 ,也 可 用 基于 CSA 的 阵列 乘法 器 ,流水 线 乘法 器 .MBA 十 WT 乘法 器 等 实现 。 两 个 位 
数 相 乘 得 到 2n 位 数 乘积 , 若 结 果 只 取 低 位 , 则 乘积 高 ”位 必须 是 0( 无 符号 数 乘法 ) 或 符 
号 ( 补 码 乘法 ) ,否则 溢出 。 对 于 一 位 乘法 ,” 位 数 相 乘 大 约 需 要 nn 次 加 减 运 算 和 nn 次 右 移 

(5) 除法 运算 : 包括 无 符号 数 除法 、 补 码 除法 和 原 码 除法 ,都 可 用 加 减 及 左 移 运算 实 
现 。 无 符号 数 除法 用 于 无 符号 整数 ,有 恢复 余数 法 和 不 恢复 余数 法 两 种 ; 补 码 除法 用 于 带 符 
号 整数 ,符号 位 和 数值 位 一 起 运算 ,也 有 恢复 余数 法 和 不 恢复 余数 法 两 种 ; 原 码 除法 用 于 浮 
点 数 尾数 ,符号 和 数值 分 开 运 算 ,数值 部 分 用 无 符号 数 除法 实现 。 因 为 除法 运算 无 法 事先 确 
定做 加 法 还 是 减法 ,所 以 无 法 实现 流水 线 除 法 器 。 两 个 位 数 相 除 时 ,需要 将 被 除数 扩展 成 
2n 位 数 , 对 于 不 恢复 余数 法 ,n 位 数 除法 大 约 需 要 n 次 加 减 运算 和 nn 次 左 移 运 算 。 

4. 浮 点 运算 及 浮 点 运算 器 

计算 机 中 大 多 用 IEEE 754 标准 表示 淫 点 数 , 因 此 , 淫 点 运算 主要 针对 IEEE 754 标准 
浮 点 数 。 浮 点 运算 由 专门 的 浮 点 运算 器 实现 ,因为 一 个 浮 点 数 由 一 个 定点 小 数 和 一 个 定点 
整数 组 成 ,所 以 泽 点 运算 器 由 定点 运算 部 件 构成 ,其 核心 部 件 还 是 带 先 行进 位 加 法 器 的 
ALU。 浮 点 运算 包括 浮 点 加 减 运算 和 浮 点 乘除 运算 。 

(1) 加 减 运算 : 按照 对 阶 、 尾 数 加 减 、 规 格 化 、 舍 信和 洲 出 判断 步骤 完成 。 对 阶 时 小 阶 
向 大 阶 看 齐 , 阶 小 的 那个 数 的 尾数 右 移 ,直到 两 数 阶 码 相同 , 右 移 时 一 般 保 留 两 位 或 三 位 附 
加 位 ;尾数 加 减 时 用 原 码 加 减 运算 实现 ;规格 化 处 理 时 根据 结果 的 尾数 形式 的 不 同 确定 进行 
左 规 或 右 规 操作 ; 舍 人 操作 有 就 近 舍 人 、 正 向 舍 人 、 负 向 舍 人 和 截 去 4 种 方式 ,默认 的 是 就 近 
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，。” 合 人 到 侦 数 方式 ; 洲 出 判断 主要 根据 结果 的 阶 码 进行 判断 , 当 发 生 阶 码 上 溢 时 ,运算 结果 发 
| 生 溢出 , 当 发 生 阶 码 下 溢 时 ,运算 结果 近似 为 0。 

(2) 乘除 运算 : 尾数 用 原 码 小 数 的 乘 / 除 运算 实现 , 阶 码 用 移 码 加 减 运 算 实现 ,需要 对 
结果 进行 规格 化 、 舍 人 和 溢出 判断 。 


3.3 ”基本 术语 解释 


逻辑 移 位 (Logical Shift) 

逻辑 移 位 是 对 无 符号 数 进 行 的 移 位 ,把 无 符号 数 看 成 一 个 逻辑 数 进 行 移 位 操作 。 左 移 
时 ,高 位 移出 ,低位 补 0; 右 移 时 ,低位 移出 ,高 位 补 0。 

算术 移 位 (Arithmetic Shift) 

算术 移 位 是 对 带 符号 整数 进行 的 , 移 位 前 后 符号 位 不 变 。 移 位 时 ,符号 位 不 动 ,只 是 数 
值 部 分 进行 移 位 。 左 移 时 ,高 位 移出 , 末 位 补 0, 移 出 非 符 时 ,发 生 溢 出 。 右 移 时 高 位 补 符 ， 
低位 移出 。 移 出 时 进行 含 人 操作 。 

循环 (逻辑 ) 移 位 (Rotating Shift) 

循环 移 位 是 一 种 逻辑 移 位 , 移 位 时 把 高 ( 低 ) 位 移出 的 一 位 送 到 低 ( 高 ) 位 , 即 左 移 时 ,各 
位 左 移 一 位 ,并 把 最 左边 的 位 移 到 最 右边 ; 右 移 时 ,各 位 右 移 一 位 ,并 把 最 右边 的 位 移 到 最 
左边 。 

扩展 操作 (Extending) 

在 计算 机 内 部 ,有 时 需要 将 一 个 取 来 的 短 数 扩展 为 一 个 长 数 , 此 时 要 进行 填充 (扩展 ) 处 
理 。 有 “ 零 扩 展 ” 和 “符号 扩展 ”两 种 。 

零 扩 展 (Zero Extending) 

对 无 符号 整数 进行 高 位 补 0 的 操作 称 为 “ 零 扩展 ”。 

符号 扩展 (CSign Extending) 

对 补 码 整数 在 高 位 直接 补 符 的 操作 , 称 为 “符号 扩展 ”。 

扩展 器 (Extender) 

进行 扩展 (填充 ) 操 作 的 部 件 , 称 为 扩展 器 。 一 般 输入 为 于 位 ,输出 为 24 位 。 

半 加 器 (Half Adder) 

只 考虑 本 位 两 个 加 数 而 不 考虑 低位 进位 来 生成 本 位 和 的 一 位 加 法 器 。 

全 加 器 (Full Adder,(3，2) Adder) 

不 仅 考 虑 本 位 两 个 加 数 而 且 考 虑 低位 进位 来 生成 本 位 和 的 一 位 加 法 器 。 

加 法 器 (Adder) 

能 进行 n 位 加 法 运算 的 部 件 。 

行 波 进 位 (Ripple Carry) 

在 进行 n 位 加 法 运算 时 ,低位 向 高 位 的 进位 采用 像 “ 行 波 ” 一 样 串 行 传递 的 方式 。 

行 波 进 位 加 法 器 (Ripple Carry Adder) 

行 波 进位 加 法 器 也 称 为 串 行进 位 加 法 器 , 它 通 过 ?个 全 加 器 按照 串 行 方式 连接 起 来 实 
现 。 进 位 方式 采用 行 波 进位 方式 。 
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先行 (超前 ) 进 位 (Carry LookAhead,CLA) 

通过 引入 进位 生成 和 进位 传递 两 个 进位 辅助 函数 ,使 得 加 法 器 的 各 个 进位 之 间 相 互 独 
立 、 并 行 产 生 。 这 种 进位 方式 也 称 为 并 行进 位 方式 。 

成 组 先行 进位 (Block Carry LookAhead,BCLA) 

将 数据 分 成 若干 组 ,在 每 一 组 内 ,除了 并 行 生成 组 内 各 位 向 前 面 的 进位 外 ,同时 还 通过 
组 进位 生成 和 组 进位 传递 这 两 个 组 进位 辅助 函数 ,促使 各 组 的 进位 也 能 相互 独立 、 并 行 
产生 。 

先行 进位 加 法 器 (CLA Adder) 

采用 先行 进位 方式 实现 的 加 法 器 ,也 称 为 并 行进 位 加 法 器 。 因 为 采用 先行 进位 方式 能 
够 快速 得 到 和 数 , 故 也 称 为 快速 加 法 器 。 

算术 逻辑 部 件 (Arithmetic Logic Unit) 

用 于 执行 各 种 基本 算术 运算 和 逻辑 运算 的 部 件 , 其 核心 部 件 是 加 法 器 ,有 两 个 操作 数 输 
入 端 和 低位 进位 输入 端 ,一 个 运算 结果 输出 端 和 若干 标志 信息 (如 零 标志 、 洲 出 标志 等 ) 输 出 
端 。 因 为 ALU 能 进行 多 种 运算 ,因此 ,需要 通过 相应 的 操作 控制 输入 端 来 选择 进行 何 种 

零 标志 ZF ,溢出 标志 OF ,进位 / 借 位 标志 CF, 符 号 标志 SF 

ALU 部 件 的 输出 除了 运算 结果 外 ,还 有 一 组 状态 标志 信息 。 例 如 ,ZF(Zero Flag) 为 1 
时 表示 结果 为 0;OF(Overflow Flag) 为 1 时 表示 结果 溢出 ;CF(CCarry Flag) 为 1 表示 在 最 高 
位 产生 了 进位 或 借 位 ;SF(Sign Flag) 和 符号 位 保持 一 致 , 若 为 1 则 表示 结果 为 负数 。 

布 斯 算法 (Booth?s Algorithm) 

是 一 种 一 位 补 码 乘法 算法 ,用 于 带 符号 数 的 乘法 运算 ,由 Booth 提出 。 算 法 的 基本 思想 
是 在 乘 数 的 末 位 添加 一 个 “0”, 乘 数 中 出 现 的 连续 “0” 和 连续 “1” 处 不 进行 任何 运算 ;出 现 
“10? 时 ,做 减法 :出现 “01? 时 ,做 加 法 。 每 次 只 做 一 位 乘法 ,因而 每 一 步 都 右 移 一 位 。 

改进 布 斯 算法 , 基 -4 Booth 算法 (Modified Booth’s Algorithm,MBA) 

从 布 斯 算法 推导 得 到 ,采用 两 位 一 乘 ,根据 乘 数 中 连续 三 位 的 不 同 取 值 确定 每 一 步 相 应 
的 运算 ,每 次 部 分 积 右 移 两 位 。 

对 阶 (Align Exponent) 

浮 点 数 加 / 减 运算 时 ,在 尾数 相 加 / 减 之 前 所 进行 的 操作 称 为 对 阶 。 对 阶 时 ,需要 比较 两 
个 阶 的 大 小 。 阶 小 的 那个 数 的 尾数 右 移 , 阶 码 增 量 。 右 移 一 次 , 阶 码 加 1, 直 到 两 数 的 阶 码 
相等 为 止 。 

溢出 (Overflow) 

溢出 是 指 一 个 数 比 给 定 的 格式 所 能 表示 的 最 大 值 还 要 大 ,或 比 最 小 值 还 要 小 的 现象 。 
因为 无 符号 数 、 带 符号 整数 和 浮 点 数 的 位 数 是 有 限 的 ,所 以 ,都 有 可 能 发 生 溢出 ,但 判断 溢出 
的 具体 方法 不 同 。 

阶 码 下 洪 (Exponent Underflow) 

在 浮 点 数 运算 中 , 当 运 算 的 结果 其 指数 ( 阶 码 ) 比 最 小 允许 值 还 小 ,此 时 ,运算 结果 发 生 
阶 码 下 溢 ,也 即 运算 结果 的 实际 值 位 于 0 和 绝对 值 最 小 的 可 表示 数 之 间 。 通 常 机 器 会 把 阶 
码 下 溢 时 浮 点 数 的 值 置 为 0。 因 此 ,这 种 情况 下 结果 并 没有 发 生 错 误 , 只 是 得 到 了 一 个 近似 
于 0 的 值 , 因 而 无 须 进行 溢出 处 理 。 


第 


! 
| 章 


计算 机 组 成 与 系统 对 欧 习 题解 答 与 裘 学 持 蛙 


阶 码 上 洲 (Exponent Overflow) 

在 浮 点 数 运算 中 , 当 运 算 的 结果 其 指数 ( 阶 码 ) 超 过 了 最 大 允许 值 ,此 时 , 浮 点 数 发 生 了 
上 游 。 即 向 oo 方向 溢出 。 如 果 结 果 是 正 数 , 则 发 生 正 上 洪 , 有 的 机 器 把 值 置 为 十 wo; 如 果 是 
负数 , 则 发 生 负 上 游 , 有 的 机 器 把 值 置 为 一 上 2o。 这 种 情况 为 软件 故障 ,通常 要 引入 溢出 故障 
处 理 程序 来 处 理 。 

规格 化 数 (Normalized Number) 

为 了 使 浮 点 数 中 能 尽量 多 地 表示 有 效 位 数 , 一 般 要 求 运 算 结果 用 规格 化 数 形 式 表示 。 规 
格 化 浮 点 数 的 尾数 小 数 点 后 的 第 一 位 一 定 是 个 非 零 数 。 因 此 ,对 于 原 码 编 码 的 尾数 来 说 ,只 要 
看 尾数 的 第 一 位 是 否 为 1 就 行 ; 对 于 补 码 表示 的 尾数 ,只 要 看 符号 位 和 尾数 最 高 位 是 否 相反 。 

左 规 (Left Normalize) 

在 浮 点 数 运算 中 , 当 一 个 尾数 的 数值 部 分 的 高 位 出 现 0 时 ,尾数 为 非 规格 化 形式 。 此 
时 ,进行 “ 左 规 ?操作 : 尾数 左 移 一 位 , 阶 码 减 1, 直 到 尾数 为 规格 化 形式 为 止 。 

右 规 (Right Normalize) 

在 浮 点 数 运算 中 , 当 尾 数 最 高 有 效 位 有 进位 时 ,发 生 尾 数 溢出 。 此 时 ,进行 “ 右 规 ?操作 
尾数 右 移 一 位 , 阶 码 加 1, 直到 尾数 为 规格 化 形式 为 止 。 右 规 过 程 中 ,要 判断 是 否 发 生 溢出 。 
此 时 ,只 要 阶 码 不 发 生 上 滋 ,那么 浮 点 数 就 不 会 溢出 。 

舍 入 (Rounding) 

伟人 是 指数 值 数 据 右 部 的 低位 数据 需要 丢弃 时 ,为 保证 丢弃 后 数值 误差 尽量 小 而 考虑 
的 一 种 操作 。 例 如 ,定点 整数 “ 右 移 ”时 、 浮 点 加 / 减 运 算 中 某 数 “对 阶 ” 时 、 浮 点 运算 结果 “ 右 
规 ” 时 都 会 涉及 舍 信 。 

保护 位 (Guard Bit) 和 舍 入 位 (Rounding Bit) 

为 了 使 浮 点 数 的 有 效 数据 位 在 右 移 时 最 大 限度 地 保证 不 丢失 ,一般 在 运算 过 程 中 得 到 
的 中 间 值 后 面 增加 若干 数据 位 ,这 些 位 用 来 保存 右 移 后 的 有 效 数 据 , 因 此 ,它们 是 添加 的 附 
加 位 。 增 设 附加 位 后 ,能 保证 运算 结果 具有 一 定 的 精度 ,但 最 终 必 须 将 附加 位 去 掉 , 以 得 到 
规定 格式 的 浮 点 数 , 此 时 要 考虑 舍 人 。 在 IEEE 754 标准 中 规定 , 浮 点 运算 的 中 间 结 果 可 以 
额外 多 保留 两 位 附加 位 ,这 两 位 分 别称 为 保护 位 和 使 和信 位。 

粘 位 (Sticky Bit) 

IEEE 754 中 规定 ,为 了 更 进一步 提高 计算 精度 ,可 以 在 舍 人 位 右边 再 增加 一 位 , 称 为 
“ 粘 位 ”, 只 要 舍 人 位 的 右边 还 有 任何 非 零 数位 , 则 粘 位 为 1, 否则 为 0。 

运算 器 (Operational Unit) 

即 运算 部 件 ,通常 指 用 ALU 以 及 为 了 完成 ALU 的 运算 而 必须 与 之 共同 工作 的 各 种 寄 
存 器 、 多 路 选择 器 和 实现 数据 传送 的 总 线 等 构成 的 部 件 。 根 据 功 能 不 同 有 定点 运算 器 和 浮 
点 运算 器 ,它们 是 数据 通路 中 的 核心 部 件 。 

通用 寄存 器 组 (General Register Set,GRS) 

CPU 中 提供 了 若干 个 通用 寄存 器 ,这 些 寄 存 器 可 以 用 来 存放 指令 操作 的 对 象 ,需要 在 
指令 中 明确 给 出 寄存 器 的 编号 ,所 有 通用 寄存 器 合 起 来 构成 一 个 通用 寄存 器 组 ,也 称 为 寄存 
器 堆 或 寄存 器 文件 (Register File) 。 通 常 ,通用 寄存 器 组 有 两 个 读 口 和 一 个 写 口 。 

多 路 选择 器 (Multiplexer) 

在 多 个 输入 数据 中 根据 控制 信号 选择 其 一 作为 输出 的 部 件 。 
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桶 形 移 位 器 (Barrel Shifter) 

由 大 量 多 路 选择 器 实现 的 快速 移 位 器 ,可 一 次 左 移 或 右 移 多 位 ,移动 位 数 由 控制 输入 端 
给 出 。 

Q 乘 商 寄 存 器 (Q Maultiplier-quotient Register) 

Q 乘 商 寄存 器 用 于 乘除 运算 。 在 乘法 中 该 寄存 器 用 来 存放 乘 数 ,在 除法 中 用 来 存放 
商 ,并 可 以 和 另外 的 移 位 器 共同 完成 左 移 ( 用 于 除法 ) 或 右 移 (用 于 乘法 ) 操 作 。 


3.4 常见 问题 解答 


1, 无 符号 加 法 器 如 何 实现 ? 

答 : 计算 机 中 ,最 基本 的 加 法 器 是 无 符号 加 法 器 。 根 据 进 位 方式 的 不 同 , 有 3 种 基本 实 
现 方式 。 串 行进 位 加 法 器 ( 行 波 进位 加 法 器 ): 通过 nn 个 全 加 器 按照 串 行 方式 连 起 来 实现 。 
并 行进 位 加 法 器 (先行 进位 加 法 器 ): 通过 引信 进位 生成 函数 和 进位 传递 函数 ,使 得 进位 之 
间 相 互 独立 、 并 行 产生 。 并 行进 位 加 法 器 也 称 为 快速 加 法 器 。 进 位 选择 加 法 器 : 通过 选择 
两 个 分 别 带 进位 0 和 1 的 高 位 部 分 加 法 器 的 输出 来 实现 高 低 两 部 分 的 并 行 执 行 。 

2， 补 码 加 法 器 如 何 实现 ? 

答 : 两 个 =” 位 补 码 进行 加 法 运算 的 规则 是 : 两 个 = 位 补 码 直接 相 加 ,并 将 结果 中 最 高 位 
的 进位 丢掉 。 也 即 采用 模 运算 方式 。 显 然 , 可 用 一 个 位 无 符号 加 法 器 来 生成 各 位 的 和 。 
最 终 的 结果 是 否 正 确 , 取 决 于 结果 是 否 溢出 ,只 要 不 溢出 , 则 结果 一 定 是 正确 的 。 因 此 , 补 码 
加 法 器 只 要 在 无 符号 加 法 器 的 基础 上 再 增加 “溢出 判断 电路 ” 即 可 。 

3. 在 补 码 加 法 器 中 ,如 何 实现 补 码 减法 运算 ? 

答 : 补 码 减法 的 规则 是 : 两 个 数 差 的 补 码 可 用 第 一 个 数 的 补 码 加 上 男 一 数 的 负数 的 补 
码 得 到 。 由 此 可 见 ,减法 运算 可 在 加 法 器 中 运行 。 只 要 在 加 法 器 的 第 二 个 输入 端 输入 减 数 
的 负数 的 补 码 。 求 一 个 数 的 负数 的 补 码 电 路 称 为 “负数 求 补 电路 ”。 可 以 通过 “各 位 取 反 、 末 
尾 加 1” 来 实现 “负数 求 补 电路 ”。 

4. 现代 计算 机 中 是 否 要 考虑 原 码 加 / 减 运 算 ? 

答 : 现代 计算 机 中 浮 点 数 采用 IEEE 754 标准 表示 , 因此 在 进行 两 个 浮 点 数 加 减 运算 
时 ,必须 考虑 原 码 的 加 减 运算 ,因为 ,IEEE 754 规定 浮 点 数 的 尾数 都 用 原 码 表示 。 

5. 加 法 器 的 运算 速度 取决 于 什么 ? 

答 : 在 门 电路 延迟 一 定 的 情况 下 ,加 法 器 的 速度 主要 取决 于 进位 方式 ,先行 进位 方式 比 
串 行进 位 方式 的 速度 快 。 

6. 定点 整数 运算 要 考虑 增加 保护 位 和 舍 入 吗 ? 

答 : 不 需要 。 整 数 运 算 的 结果 还 是 整数 ,没有 误差 ,无 须 考虑 增加 保护 位 ,也 无 须 考虑 
伟人 。 但 运算 结果 可 能 会 < 溢出”。 

7. 如 何 判断 带 符号 整数 运算 结果 是 否 溢出 ? 

答 : 带 符号 整数 用 补 码 表 示 , 对 于 单 符号 补 码 ( 即 2- 补 码 ) 和 双 符 号 补 码 ( 即 年 补 码 , 变 
形 补 码 ) ,其 溢出 判断 方式 不 同 。 变 形 补 码 运算 的 溢出 判断 规则 为 :“ 当 结果 的 两 个 符号 位 
不 同时 ,发 生 溢出 ”。 单 符号 补 码 运算 时 , 异 号 数 相 加 不 会 溢出 , 面 对 于 同 号 数 相 加 , 则 有 两 
种 判断 规则 。 规 则 1 为 :“ 若 结果 的 符号 与 两 个 加 数 的 符号 不 同 , 则 发 生 溢出 ”。 规 则 2 为 : 
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“ 若 最 高 位 的 进位 和 次 高 位 的 进位 不 同 , 则 发 生 溢出 ”。 

8. 在 计算 机 中 ,乘法 和 除法 运算 如 何 实现 ? 

答 : 乘法 和 除法 运算 是 通过 加 、 减 运算 和 左 、 右 移 位 运算 来 实现 的 。 只 要 用 加 法 器 和 移 
位 寄存 器 在 控制 逻辑 的 控制 下 就 可 以 实现 乘除 运算 。 也 可 用 专门 的 乘法 器 和 除法 器 实现 。 

9. 浮 点 数 如 何 进行 舍 入 ? 

答 : 舍 人 方法 选择 的 原则 是 : (1) 尽 量 使 误差 范围 对 称 ,使 得 平均 误差 为 0, 即 有 舍 有 
入 ,以 防 误差 积累 。(2) 方 法 要 简单 ,以 加 快速 度 。 

IEEE 754 有 4 种 舍 人 方式 :(1) 就 近 舍 人 : 舍 人 为 最 近 可 表示 的 数 , 若 结 果 值 正好 落 在 
两 个 可 表示 数 的 中 间 , 则 一 般 选 择 舍 人 结果 为 偶数 。(2) 正 向 舍 人 : 朝 十 ce 方向 售 人 , 即 取 
右边 的 那个 数 。(3) 负 向 售 人 : 朝 一 ce 方向 伟人 , 即 取 左 边 的 那个 数 。(4? 截 去 : 朝 0 方向 
舍 信 。 即 取 绝 对 值 较 小 的 那个 数 。 

10. 在 C 语言 程序 中 ,为 什么 以 下 程序 段 最 终 的 了 值 为 0, 而 不 是 2.5? 


float f=2.5+1e10; 
f=f-1lel0; 


答 , 首先 ,float 类 型 采用 IEEE 754 单 精 度 浮 点 数 格式 表示 ,因此 ,最 多 有 24 位 二 进 制 
有 效 位 数 。 因 为 1e10 二 10 二 10X10 X10 ,在 数量 级 上 大 约 相当 于 2 X2” X22 一 28 ,而 
2. 5 的 数量 级 为 2: ,因此 ,在 计算 2. 5 十 lel0 进行 对 阶 时 ,两 数 阶 码 的 差 为 32, 也 就 是 说 ,2.5 
的 尾数 要 向 右 移 32 位 ,从 而 使 得 24 位 有 效 数字 全 部 丢失 ,尾数 变 为 全 0, 再 与 1e10 的 尾数 
相 加 时 结果 就 是 1e10 的 尾数 ,因此 f=2.5 十 lel0 的 运算 结果 仍 为 le10, 这 样 ,再 执行 
一 7 一 lel0 时 结果 就 为 0。 这 就 是 典型 的 大 数 吃 小 数 的 例子 。 


3.5 单项 选择 题 
1. 8 位 无 符号 整数 1001 0101B 右 移 一 位 后 的 值 为 ( )。 
A. 0100 1010B B. 0100 1011B 
C. 1000 1010B D. 1100 101B 
2. 8 位 补 码 定点 整数 1001 0101B 右 移 一 位 后 的 值 为 ( €  )。 
A., 0100 1010B B. 0100 1011B 
C. 1000 1010B D. 1100 1010B 
3. 8 位 补 码 定点 整数 1001 0101B 左 移 一 位 后 的 值 为 ( €  )。 
A. 1010 1010B B. 0010 1010B 
C. 0010 1011B D. 溢出 
4. 8 位 补 码 定 点 整数 1001 0101B 扩展 8 位 后 的 值 用 十 六 进 制 表示 为 ( €  )。 
A. 0095H B. 9500H 
C. FF95H D. 95FFH 
5. 原 码 定点 小 数 1. 1001 0101B 扩展 8 位 后 的 值 为 (  )。 
A. 1.0000 0000 1001 0101B B. 1.1001 0101 0000 0000B 


C. 1.1111 1111 1001 0101B D. 1.1001 0101 1111 1111B 


和 运 划 广 法 和 运 茎 剖 件 


6. 考虑 以 下 C 语言 代码 : 


Short si=-8196; 


int i=si; 
执行 上 述 程序 段 后 ,i 的 机 器 数 表示 为 ( ” )。 
A. 0000 9FFCH B. 0000 DFFCH 
C. FFFF 9FFCH D. FFFF DFFCH 
7. CPU 中 能 进行 算术 和 逻辑 运算 的 最 基本 运算 部 件 是 ( )。 
A. 多 路 选择 器 B. 移 位 器 
C. 加 法 器 D. ALU 
8. ALU 的 核心 部 件 是 ( )。 
A. 多 路 选择 器 B. 移 位 器 
C, 加 法 器 D. 寄存 器 


9. 假定 T 表示 一 级 门 延迟 ,一 个 异 或 门 的 延迟 为 3T, 不 考虑 线 延 迟 , 则 8 位 全 先行 进 
位 加 法 器 的 关键 路 径 延 迟 为 (  )。 
A. 6T B. 8T C. 16T D; 17T 
10. 74181 ALU 的 功能 是 ( )。 
A. 实现 16 种 4 位 算术 运算 
B. 实现 16 种 4 位 逻辑 运算 
C. 实现 16 种 4 位 算术 和 逻辑 运算 
D. 实现 4 位 乘法 运算 和 4 位 除法 运算 
11. 在 补 码 加 / 减 运算 部 件 中 ,无论 采用 双 符 号 位 还 是 单 符号 位 ,必须 有 ( ) 电 路 , 它 
一 般 用 异 或 门 来 实现 。 
A. 译 码 B. 编码 C. 溢出 判断 D. 移 位 
12. 某 计算 机 字 长 为 8 位 ,其 CPU 中 有 一 个 8 位 加 法 器 。 已 知 无 符号 数 z 一 69,y 一 
38, 现 要 在 该 加 法 器 中 完成 x 十 y 的 运算 ,此 时 该 加 法 器 的 两 个 输入 端 信息 和 输入 的 低位 进 
位 信息 分 别 为 ( ” )。 
A. 0100 0101B.0010 0110B、0 B. 0100 0101B、0010 0110B.1 
C. 0100 0101B、1101 1010B.0 D. 0100 0101B、1101 1010B、1 
13. 某 计算 机 字 长 为 8 位 ,其 CPU 中 有 一 个 8 位 加 法 器 。 已 知 无 符号 数 z==69,y 二 
38, 现 要 在 该 加 法 器 中 完成 x 一 y 的 运算 ,此 时 该 加 法 器 的 两 个 输入 端 信息 和 输入 的 低位 进 
位 信息 分 别 为 ( ” )。 
A. 0100 0101B,0010 0110B.0 B. 0100 0101B,1101 1001B,1 
C. 0100 0101B,1101 1010B、0 D. 0100 0101B、1101 1010B.,1 
14. 某 计 算 机 字 长 为 8 位 ,其 CPU 中 有 一 个 8 位 加 法 器 。 已 知 带 符号 整数 z 一 一 69， 
3 二 一 38, 现 要 在 该 加 法 器 中 完成 x 十 y 的 运算 ,此 时 该 加 法 器 的 两 个 输入 端 信息 和 输入 的 
低位 进位 信息 分 别 为 ( )。 
A. 1011 1011B,1101 1010B.0 B. 1011 1011B、1101 1010B、1 
C. 1011 1011B.0010 0101B.0 D. 1011 1011B.0010 0101B.1 
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| 15. 某 计 算 机 字 长 为 8 位 ,其 CPU 中 有 一 个 8 位 加 法 器 。 已 知 带 符号 整数 z 一 一 69， 
| 2 二 一 38, 现 要 在 该 加 法 器 中 完成 zx 一 > 的 运算 ,此 时 该 加 法 器 的 两 个 输入 端 信息 和 输入 的 
”低位 进位 信息 分 别 为 C 。 )。 
A. 1011 1011B、1101 1010B、0 B. 1011 1011B、1101 1010B、1 
C. 1011 1011B、0010 0110B、0 D. 1011 1011B、0010 0101B、1 
16. 某 8 位 计算 机 中 ,假定 zx 和 y 是 两 个 带 符号 整数 变量 ,用 补 码 表示 ,z= 63， 
2 二 一 31, 则 z 十 y 的 机 器 数 及 其 相应 的 溢出 标志 OF 分 别 是 (  )。 
A. 1FH.0 B. 20H.、0 
C. 1FH.!1 D. 20H.1 
17. 某 8 位 计算 机 中 ,假定 zx 和 y 是 两 个 带 符号 整数 变量 ,用 补 码 表示 ,z= 63， 
一 31, 则 z 一 > 的 机 器 数 及 其 相应 的 溢出 标志 OF 分 别 是 (  )。 
A. 5DH.0 B. 5EH、0 
C. 5DH.1 D. 5EH、1 
18. 某 8 位 计算 机 中 ,假定 带 符号 整数 变量 x 和 y 的 机 器 数 用 补 码 表示 ,[z]h 和 一 F5H， 
[Lyj# 二 7EH, 则 xz 十 > 的 值 及 其 相应 的 溢出 标志 OF 分 别 是 ( ) 。 
A. 115、0 B. 119、0 
C; 二 15 D. 119、1 
19. 某 8 位 计算 机 中 ,假定 带 符号 整数 变量 zx 和 y 的 机 器 数 用 补 码 表 示 , [zj 二 F5H， 
[yj# 二 7EH, 则 x 一 y 的 值 及 其 相应 的 溢出 标志 OF 分 别 是 ( 六 
A. 115、0 B. 119、0 
C. 115,1 D. 119、1 
20. 某 8 位 计算 机 中 ,假定 xz 和》 是 两 个 带 符号 整数 变量 ,用 补 码 表示 , [zj 二 44H， 
[yj# 三 DCH, 则 xz 十 2y 的 机 器 数 以 及 相应 的 溢出 标志 OF 分 别 是 ( Ns 
A. 32H.0 B. 32H.1 
C. FCH.0 D. FCH.!1 
21. 某 8 位 计算 机 中 ,假定 zx 和 y 是 两 个 带 符号 整数 变量 ,用 补 码 表示 , [zj 二 44H， 
[yj# 二 DCH, 则 zx 一 2y 的 机 器 数 以 及 相应 的 溢出 标志 OF 分 别 是 ( ”)。 
A. 68H.0 B. 68H.1 
C. 8CH、0 D. 8CH.1 
22. 某 8 位 计算 机 中 ,假定 x 和 y 是 两 个 带 符号 整数 变量 ,用 补 码 表示 , [zj 二 44H， 
[y]# 一 DCH, 则 z/2 十 2y 的 机 器 数 以 及 相应 的 溢出 标志 OF 分 别 是 (  ”)。 
A. CAH.0 B. CAH\、1 
C. DAH、0 D. DAH 1 
23. 假定 有 两 个 整数 用 8 位 补 码 分 别 表示 为 r1 二 F5H,r2 二 EEH。 若 将 运算 结果 存放 
在 一 个 8 位 寄存 器 中 , 则 下 列 运 算 中 会 发 生 溢出 的 是 (  )。 
A. 7 十 72 7 ey 
| ti 兴 入 D. rl/r2 
24. 以 下 关于 原 码 一 位 乘法 算法 要 点 的 描述 中 ,错误 的 是 (  € )。 
A. 符号 位 和 数值 位 分 开 运 算 , 符 号 位 可 由 一 个 异 或 门生 成 


和 运 划 广 法 和 运 茎 部 件 


B. 通过 循环 执行 “加 法 > 和 “ 移 位 ?操作 得 到 乘积 
C. ALU 中 是 否 进行 部 分 积 与 被 乘 数 的 加 法 运算 由 乘 数 最 低位 决定 
D. 移 位 时 ,将 进位 位 、 部 分 积 和 乘积 部 分 一 起 进行 算术 右 移 
25. 假定 一 次 ALU 运算 用 1 个 时 钟 周期 , 移 位 一 次 用 1 个 时 钟 周 期 , 则 最 快 的 32 位 原 
码 一 位 乘法 所 需要 的 时 钟 周 期 数 大 约 为 (  )。 
A. 32 B. 64 C. 96 D. 100 
26. 以 下 关于 Booth 补 码 一 位 乘法 算法 要 点 的 描述 中 ,错误 的 是 (  )。 
A. 符号 位 和 数值 位 一 起 参加 运算 ,无 须 专门 的 符号 生成 部 件 
B. 通过 循环 执行 “加 / 减 ? 和 "“ 移 位 ?操作 得 到 乘积 
C. 由 乘 数 最 低 两 位 决定 对 部 分 积 和 被 乘 数 进行 何 种 运算 
D. 移 位 时 ,将 进位 位 、 部 分 积 和 乘积 部 分 一 起 进行 算术 右 移 
27. 以 下 关于 乘法 运算 部 件 的 叙述 中 ,错误 的 是 (  )。 
A. 补 码 乘法 部 件 可 用 于 带 符号 整数 的 乘法 运算 
B. 原 码 乘法 部 件 可 用 于 浮 点 数 中 尾数 相 乘 运算 
C. 快速 阵列 乘法 器 中 的 基本 部 件 包含 移 位 器 
D. 两 位 乘法 运算 比 一 位 乘法 运算 速度 约 快 一 倍 
28. 对 于 两 个 位 无 符号 整数 除法 运算 ,以 下 关于 不 恢复 余数 算法 要 点 的 描述 中 ,错误 
的 是 (  )。 
. 起 始 时 被 除数 在 高 位 扩展 位 0, 以 将 其 扩展 为 2n 位 无 符号 整数 
为 判断 中 间 余 数 的 正 / 负 , 需 在 余数 寄存 器 的 最 高 位 前 增加 一 位 符号 位 
. 至 少 需 * 十 1 次 循环 执行 “< 加/ 减 ” 和 “ 左 移 ” 操 作 才 能 得 到 位 商 
D. 运算 结果 一 定 不 会 发 生 洲 出 , 故 无 须 通 过 得 到 最 高 位 商 来 判断 溢出 
29. 对 于 IEEE 754 单 精 度 浮 点 数 加 减 运 算 ,在 对 阶 过 程 中 ,需要 计算 两 个 阶 码 Ex 和 
Ey 之 差 的 补 码 LAEJ]h 。 若 AE 之 128 或 AE 委 一 129, 则 [LAE]# 发 生 溢 出 。 假 定 LEz]#、 
[一 [LEy]##] 让 和 [AE]# 的 最 高 有 效 位 分 别 记 为 Exs、Eys 和 Ebs , 则 相应 的 溢出 判断 方程 为 
〈《 ) 。 
A. Overflow=Ezxs Eys Ebs+Ezs Eys Ebs 
B. Overflow= EzsEys Ebs+Ezs Eys Ebs 
C. Overflow= Exs Eys Ebs+ Exzs Eys Ebs 
D. Overflow= Ezxs Eys Ebs+Ezs Eys Ebs 
30. IEEE 754 单 精度 浮 点 数 加 减 运 算 的 对 阶 过 程 中 ,需要 计算 两 个 阶 码 Ez 和 Ey 之 
差 的 补 码 [LAE]#。 假 设 两 个 浮 点 数 分 别 记 为 [XJ]s 和 [Yjs ,LEzjs、LEyj 和 [LAEj# 的 最 高 
有 效 位 分 别 记 为 Ezs、Eys 和 下 ps, 当 [LAE]# 发 生 溢出 时 ,正确 的 处 理 方式 是 ( )。 
A. 中 止 当前 程序 的 执行 , 调 出 相应 的 “溢出 ?异常 处 理 程序 执行 
B. 当 Ezs 为 1 时 置 最 终结 果 为 [Xj]s ; 当 Ezs 为 0 时 置 最 终结 果 为 [站 
C. 当 Eys 为 1 时 置 最 终结 果 为 LX]x ; 当 Eys 为 0 时 置 最 终结 果 为 [Y jx 
D. 当 EBs 为 0 时 置 最 终结 果 为 LXjs ; 当 Ebs 为 1 时 置 最 终结 果 为 [Yl]s 


> 
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31. 车 两 个 (用 IEEE 754 单 精度 浮 点 格式 表示 ) 的 float 型 变量 x 和 y 的 机 器 数 分 别 表 
| 示 为 x=40E8 0000H,y 一 C204 0000H , 则 在 计算 z 十 y 时 ,第 一 步 对 阶 操作 的 结果 [AE]# 


为 ( ) 。 
A. 0000 0111B B. 0000 0011B 
C. 1111 1011B D. 1111 1101B 


32. 对 于 IEEE 754 单 精度 浮 点 数 加 减 运算 ,只 要 对 阶 时 得 到 的 两 个 阶 码 之 差 的 绝对 值 
1AE| 大 于 等 于 (  ) ,就 无 须 继续 进行 后 续 处 理 , 此 时 ,运算 结果 直接 取 阶 大 的 那个 数 。 
A. 23 B. 24 C. 126 D. 128 
33. IEEE 754 标准 提供 了 以 下 4 种 伟人 模式 ,其 中 平均 误差 最 小 的 是 ( )。 
A. 就 近 合 入 (中 间 值 时 强迫 为 偶数 ) 
B. 正 向 伟人 ( 即 朝 十 cc 方向 伟人 ) 
C. 负 向 舍 人 ( 即 朝 一 ce 方向 伟人 ) 
D. 截断 舍 人 ( 即 朝 0 方向 伟人 ) 


【参考 答案 】 

1.A 2. D 3. D 4.C 5.B 6.D 7.D 

8.C 9 10. C 11.C 12. A 13. B 14. A 

15. D 16. B 17;.,.B 18. A 19. D 20. C 21. D 

22. C 23. C 24. D 25. B 26. D 27.C 28. C 

29. DT 30. B 31. D 32. B 33. A 

3.6 分 析 应 用 题 

1. 考虑 下 列 C 语言 程序 代码 : 

int i=65535} 

Short si= (short)i; 

int j=si; 

假定 上 述 程序 段 在 某 32 位 机 器 上 执行 ,sizeof (int) 一 4, 则 变量 i、si 和 j 的 值 分 别 是 多 
少 ? 为 什么 ? 

【分 析 解 答 】 


在 一 台 32 位 机 器 上 执行 上 述 代码 段 时 ,i 为 32 位 补 码 表示 的 定点 整数 ,第 2 行 要求 强 
行将 一 个 32 位 带 符号 数 截断 为 16 位 带 符号 整数 ,65535 的 32 位 补 码 表示 为 0000 FFFFH， 
截断 为 16 位 后 变 成 FFEFFH, 它 是 一 1 的 16 位 补 码 表示 ,因此 si 的 值 是 一 1。 再 将 该 16 位 
带 符号 整数 扩展 为 32 位 时 ,就 变 成 了 FFFF FFFFH, 它 是 一 1 的 32 位 补 码 表示 ,因此 j 的 
值 也 为 一 1。 也 就 是 说 ,i 的 值 原来 为 65535 ,经 过 截断 、 再 扩展 后 ,其 值 变 成 了 一 1。 

2. 考虑 以 下 C 语言 程序 代码 : 

int funcl (unsigned word) 


{ 
return (int) ((word<<24)>>24); 


和 运 划 广 法 和 运 茎 剖 件 


} 
int func2 (unsigned word) 


{ 
return ((int) word<<24)>>24; 


} 


假设 在 一 个 32 位 机 器 上 执行 这 些 函 数 ,sizeof(int) 一 4。 说 明 函 数 funcl 和 func2 的 功 
能 ,并 填写 表 3.1, 给 出 对 表 中 “异常 ”数据 的 说 明 。 
表 3.1 题 2 用 表 
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机 器 数 


值 机 器 数 
127 


W funcl(w) func2(w) 
| 128 


255 


【分 析 解 答 】 

函数 funcl 的 功能 是 把 无 符号 数 高 24 位 清 零 ( 左 移 24 位 再 逻辑 右 移 24 位 ), 结 果 一 定 
是 正 的 带 符号 整数 ;而 函数 func2 的 功能 是 把 无 符号 数 的 高 24 位 都 变 成 和 第 25 位 一 样 , 因 
为 左 移 24 位 后 原来 的 第 25 位 变 为 左边 第 一 位 ,然后 进行 算术 右 移 ,高 位 补 符号 , 即 高 24 位 
都 变 成 和 原来 第 25 位 相同 。 程 序 执行 的 结果 如 表 3. 2 所 示 , 表 中 机 器 数 用 十 六 进 制 表示 。 


表 3.2 题 2 填 入 结果 后 的 表 


Ww funcl(w) func2(w) 

机 器 数 ”| 值 机 器 数 什 机 器 数 ”| ” 值 
0000007FH | 127 0000007FH 十 127 0000007FH | 127 
00000080H | 128 00000080H 十 128 FFFFFF80H | 一 128 
000000FFH | 255 O00000FFH 十 255 FFFFFFFFH | —1 
00000100H 256 00000000H 0 00000000H 0 


上 述 表 3.2 中 ,加 粗 数据 是 一 些 “ 异 常 ?结果 。 当 zw 一 128 和 w 王 255 时 ,第 25 位 正好 是 
1, 因 此 函数 func2 执行 的 结果 为 一 个 负数 ,出 现 了 “异常 ?。 当 w 二 256 时 , 低 8 位 为 00, 高 
24 位 为 非 0 值 , 左 移 24 位 后 使 得 有 效 数字 被 移出 ,因而 发 生 了 “ 游 出 ”, 导 致 出 现 了 “异常 ” 


结果 0。 

3. 以 下 是 两 段 C 语 言 代 码 , 函 数 arith 是 直接 用 C 语言 写 的 ,而 optarith 是 对 arith 函 
数 以 某 个 确定 的 M 和 六 编译 生成 的 机 器 代码 进行 反 编译 而 成 的 。 根 据 optarith 推断 函数 
arith 中 M 和 N 的 值 各 是 多 少 ? 


#define M 
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{ 


} 


#define N 
int arith (int x, int y) 


int result=0; 
result=x*M+y/N; 
return result; 


int optarith (int x, int y) 


{ 


} 


int t=x} 

X <<=47 

pi 

if (y<0) y+=3; 
y>>=2; 

return x+y; 


【分 析 和 解答】 


对 反 编译 结果 进行 分 析 , 可 知 : 对 于 x, 指令 机 器 代码 中 有 一 条 “x 左 移 4 位 ”指令 , 即 
Z< 16z, 然 后 有 一 条 “减法 ?指令 , 即 z<-16zx 一 zx 二 15z, 根 据 源 程序 知 M 二 15; 对 于 ,有 一 
条 “y 右 移 2 位 ”指令 , 即 yy/4, 根 据 源 程序 知 N= 二 4。 但 是 , 当 y<0 时 ,对 于 有 些 y, 执 行 
y>>2 后 的 值 并 不 等 于 y/4。 例 如 , 当 y= 二 一 1 时 ,在 反 编 译 函 数 optarith 中 执行 y>>>2 时 ， 
因为 一 1 的 机 器 数 为 全 1, 右 移 两 位 后 还 是 全 1, 即 一 1>>2 王 一 1, 结 果 为 一 1; 而 原 函数 arith 
中 执行 y/4 时 ,因为 一 1/4 二 0, 得 到 结果 为 0。 同样 ,y 二 一 2、y 二 一 3 和 y 一 一 5 等 情况 下 都 
会 发 生 y>>2 关 y/4 的 结果 。 因 为 当 y<0 时 ,《y 十 3)/4 二 y/4, 所 以 ,函数 optarith 中 在 执行 


y>>2 之 前 加 了 一 条 语句 “f(y<0) y 十 二 3;”, 以 对 y 进行 调整 。 


4. 设 A4~Al 和 Bi 一 Bi 分 别 是 4 位 加 法 器 的 两 组 输入 ,Ce 为 低位 来 的 进位 。 当 加 法 


器 分 别 采 用 串 行进 位 和 先行 进位 时 , 写 出 4 个 进位 Ci 一 Ci 的 逻辑 表达 式 。 
【分 析 解 答 】 
串 行进 位 ， 


Ci 一 AiB 十 AiCo 十 BC C 一 A:B: 十 4A:C 十 B:Ci 


Cs 一 A: B: 十 AsC: 十 BsCz 


并 行进 位 : 


5. 说 明 如 何 月 


Ci 一 4B 十 (4 十 Bi)Co 


CG=AiBtACst B,C; 


CA:B: 十 (4 十 B:)AiB 十 (4 十 B: (CA 十 Bi)OC 
Cs 一 4;B: 十 (4: 十 B:)A:B: 十 (4A: 十 Bs)(C4: 十 B:) AB, 


二 (As 十 Bs)(A;+B;)(A+ 


上 了 3 ) Co 


Ci 一 A,B 十 (4 十 Bi)A:Bs 十 (4 十 BC4: 十 B:)A: B。 


十 (A 十 Bs)(A;s 十 B;)(A,+1 


+ B2) AB, 


十 (A 十 Bs) (CAs 十 Bs)(As1 
有 SN74181 和 SN74182 器 件 设计 一 个 16 位 先行 进位 补 码 加 / 减 运 算 部 


HB) (Ai+B,)Co 
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件 ,并 给 出 零 标志 、 进 / 借 位 标志 、 溢 出 标志 、 符 号 标志 的 逻辑 表达 式 。 

【分 析 解 答 】 

假定 两 个 操作 数 分 别 为 A=A45~A4,B 一 Bi 一 Bo ,结果 用 FE 一 Fo 表示 ,最 高 位 向 前 
的 进位 用 Ci 表示。 首先 用 4 个 SN74181 和 1 个 SN74182 构成 一 个 16 位 无 符号 数 先行 进 
位 加 法 器 ,然后 在 4 个 SN74181 的 输入 端 B 的 每 位 加 一 个 异 或 门 , 异 或 门 的 一 个 输入 是 
了 B,, 另 一 个 输入 是 最 低位 进位 Cu, 即 B 一 Bi 中 Cs ,这 样 在 CQ 二 1 时 作 减 法 , 当 C, 二 0 时 作 加 
法 。( 详 细 设计 可 参考 主教 材 D 中 图 3. 15 和 图 3. 16) 

零 标志 ZF 的 逻辑 表达 式 为 ZF 一 丽 ; 干 … 干 已 ;通常 ,无 符号 数 加 、 减 运算 和 带 符号 整 
数 ( 补 码 ) 加 、 减 运算 都 在 上 面 描述 的 同一 个 加 / 减 运 算 部 件 中 执行 , 进 / 借 位 标志 CF 在 带 符 
号 整数 ( 补 码 ) 运 算 中 没有 意义 ,因此 只 需 根据 无 符号 数 运算 时 CF 的 含义 来 考虑 CF 的 逻 
辑 表 达 式 。 对 于 无 符号 加 / 减 运 算 , 当 C= 二 0 时 ,CF 二 Cu ,而 当 Co=1 时 ,CF 一 Co, 所 以 
CF 二 CG, 加 Cis ;溢出 标志 OF 对 无 符号 数 加 / 减 运 算 没 有 意义 ,因此 ,只 需 根 据 补 码 加 / 减 运 
算 中 OF 的 含义 来 考虑 OF 的 逻辑 表达 式 。 在 补 码 加 / 减 运算 中 ,车 两 个 加 数 的 符号 相同 ， 
但 不 同 于 结果 的 符号 , 则 结果 肯定 溢出 ,因此 ,OF 一 4 Bi Fs 十 Al; Bi Fis ;符号 标志 SF 
只 对 补 码 加 / 减 运算 有 意义 , 当 结 果 为 负数 时 ,Fis 二 1, 故 SF= 下。 

6. 说 明 如 何 用 SN74181 和 SN74182 器 件 设 计 一 个 32 位 的 ALU, 要 求 采 用 两 级 先行 
进位 结构 ,给 出 所 需要 的 SN74181 和 SN74182 芯片 数 。 

【分 析 解 答 】 

首先 用 4 个 SN74181 和 1 个 SN74182 构成 一 个 16 位 无 符号 数 先行 进位 加 法 器 ,然后 
在 输入 端 B 增 加 “ 取 补 ”电路 以 枸 成 补 码 加 / 减 运 算 部 件 ,这 样 ,得 到 一 个 16 位 两 级 先行 进 
位 加 / 减 运算 部 件 。 将 这 样 的 两 个 16 位 加 / 减 运算 部 件 串 联 起 来 ,串联 时 ,注意 将 低 16 位 对 
应 的 那个 部 件 的 最 高 位 进位 Ci 作为 高 16 位 对 应 的 那个 部 件 的 最 低位 进位 ,并 且 , 高 16 位 
对 应 的 那个 部 件 中 ,在 SN74181 的 输入 端 B 处 的 异 或 门 的 其 中 一 个 输入 为 B;, 男 一 个 输入 
则 与 低 16 位 对 应 部 件 的 相应 异 或 门 输入 端 一 样 ,都 是 Cu 而 不 是 Ce。 一 共 需 要 8 个 
SN74181 和 2 个 SN74182。 

7. 某 字 长 为 8 位 的 计算 机 中 ,zx 和 > 为 无 符号 整数 ,已 知 x 二 68,y 二 80,x 和 y 分 别 存 
放 在 寄存 器 A 和 B 中 。 请 回答 下 列 问 题 ( 要 求 最 终 用 十 六 进 制 表示 二 进 制 序列 ) 。 

(1) 寄存 器 A 和 B 中 的 内 容 分 别 是 什么 ? 

(2) 车 xz 和 相 加 后 的 结果 存放 在 寄存 器 C 中 , 则 寄存 器 C 中 的 内 容 是 什么 ? 运算 结 
果 是 否 正确 ?此 时 , 零 标 志 ZF 是 什么 ? 加 法 器 最 高 位 的 进位 C, 是 什么 ? 

(3) 车 xz 和 yy 相 减 后 的 结果 存放 在 寄存 器 D 中 , 则 寄存 器 D 中 的 内 容 是 什么 ? 运算 结 
果 是 否 正确 ? 此 时 , 零 标 志 ZF 是 什么 ?加 法 器 最 高 位 的 进位 C, 是 什么 ? 

(4) 无 符号 整数 加 / 减 运算 时 ,加 法 器 最 高 位 进位 C, 的 含义 是 什么 ? 它 与 进 / 借 位 标志 
CF 的 关系 是 什么 ? 

(5) 无 符号 整数 一 般 用 来 表示 什么 信息 ? 为 什么 通常 不 对 无 符号 整数 的 运算 结果 判断 
溢出 ? 


@ 主教 材 指 《计算 机 组 成 与 系统 结构 )( 喜 春风 编著 ,清华 大 学 出 版 社 ,2010. 4) 


第 
| 3 
| 齐 


和 与 系统 结 攀 习题 解答 与 朝 学 兰 旱 


| 【分 析 解 答 】 
| (1) z==68 二 01000100B= 二 44H;y 二 80 二 01010000B= 二 50H。 所 以 ,寄存 器 A 和 B 中 的 
， 内 容 分 别 是 44H 和 50H。 

(2) z 十 y 二 01000100B 十 01010000B 二 (0〉10010100B 二 94H, 所 以 ,寄存 器 C 中 的 内 容 
为 94H, 对 应 的 真 值 为 148 ,运算 结果 正确 。 因 为 结果 不 为 0, 所 以 ZF 二 0; 加 法 器 最 高 位 的 
进位 C, 为 0。 

(3) Zz 一 y= 二 zx 十 [一 yj 二 01000100B 十 10110000B 二 (0) 11110100B=F4H, 所 以 ,寄存 
器 了 中 的 内 容 为 F4H ,对 应 的 真 值 为 244, 运 算 结 果 不 正确 ,这 是 因为 相 减 结果 为 负数 造成 
的 。 因 为 结果 不 为 0, 所 以 ZF=0; 加 法 器 最 高 位 的 进位 C, 为 0。 

(4) 在 加 法 器 中 进行 无 符号 整数 加 法 运算 时 , 若 加 法 器 最 高 位 进位 C.=1, 则 表示 实际 
结果 大 于 最 大 可 表示 数 255; 在 加 法 器 中 进行 无 符号 整数 减法 运算 时 , 若 加 法 器 最 高 位 进位 
C,=1, 则 表示 被 减 数 大 于 减 数 ,反之 被 减 数 小 于 减 数 。 因 此 ,在 无 符号 数 相 加 时 , CF 就 等 
于 C,, 表 示 进 位 ;在 无 符号 数 相 减 时 ,通常 将 最 高 进位 C, 取 反 来 作为 借 位 标志 CF , 即 无 符 
号 整数 相 减 时 ,CF 二 C,,CF=1 表示 有 借 位 。 

(5) 无 符号 整数 一 般 用 来 表示 地 址 (指针 ) 信 息 , 当 两 个 地 址 相 加 结果 大 于 最 大 地 址 而 
取 低 位 地 址 时 ,相当 于 取 模 , 即 采用 地 址 或 指针 的 循环 运算 。 因 此 通常 不 需要 判断 其 运算 结 
果 是 否 溢出 , 即 不 考虑 溢出 标志 OF 。 

8. 假设 某 字 长 为 8 位 的 计算 机 中 , 带 符号 整数 采用 补 码 表示 ,z 一 一 68,y 一 一 80,z 和 > 
分 别 存 放 在 寄存 器 A 和 B 中 。 请 回答 下 列 问题 (要 求 最 终 用 十 六 进 制 表示 二 进 制 序列 ) 。 

(1) 寄存 器 A 和 B 中 的 内 容 分 别 是 什么 ? 

(2) 若 zx 和 >》 相 加 后 的 结果 存放 在 寄存 器 C 中 , 则 寄存 器 C 中 的 内 容 是 什么 ? 运算 结 
果 是 否 正确 ? 此 时 ,溢出 标志 OF、 符 号 标志 SF 和 零 标志 ZF 各 是 什么 ? 加 法 器 最 高 位 的 
进位 C, 是 什么 ? 

(3) 若 zx 和 y 相 减 后 的 结果 存放 在 寄存 器 D 中 , 则 寄存 器 D 中 的 内 容 是 什么 ? 运算 结 
果 是 否 正 确 ? 此 时 ,溢出 标志 OF、 符 号 标志 SF 和 零 标 志 ZF 各 是 什么 ? 加 法 器 最 高 位 的 
进位 C, 是 什么 ? 

(4) 若 将 加 法 器 最 高 位 的 进位 C, 作为 进位 标志 CF , 则 能 否 直 接 根 据 CF 的 值 对 两 个 
带 符号 整数 的 大 小 进行 比较 ? 

【分 析 解 答 】 

(1) [一 68]# 一 [一 1000100B] 王 10111100B 王 BCH。[ 一 80]# 一 [一 1010000B]# = 
10110000B 一 BOH。 所 以 ,寄存 器 A 和 B 中 的 内 容 分 别 是 BCH 和 BOH。 

(2) [zyj# =[zxj# 十 [yj 二 10111100B 十 10110000B 一 (1》〉》01101100B 一 6CH ,最 高 
位 前 面 的 一 位 1 被 丢弃 ,因此 ,寄存 器 C 中 的 内 容 为 6CH, 对 应 的 真 值 为 十 108, 结 果 不 正 
确 。 滋 出 标志 位 OF 可 采用 以 下 任意 一 条 规则 判断 得 到 。 规 则 1: 若 两 个 加 数 的 符号 位 相 
同 ,但 与 结果 的 符号 位 相 异 , 则 溢出 。 规 则 2: 若 最 高 位 上 的 进位 和 次 高 位 上 的 进位 不 同 , 则 
溢出 。 通 过 这 两 个 规则 都 能 判断 出 结果 溢出 , 即 溢出 标志 位 OF 为 1, 说 明 寄存 器 C 中 的 内 
容 不 是 正确 的 结果 。z 十 y 的 正确 结果 应 是 一 68 十 (一 80) 一 一 148 ,而 运算 的 结果 为 108, 显 
然 两 者 不 等 。 其 原因 是 zx 十 y 的 值 ( 即 一 148) 小 于 8 位 补 码 可 表示 的 最 小 值 ( 即 一 128) ,也 
即 结果 发 生 了 溢出 ;结果 的 第 一 位 0 为 符号 标志 SF, 表 示 结 果 为 正 数 。 但 因为 溢出 标志 为 
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1 ,所 以 符号 标志 实际 上 也 是 错 的 ;因为 结果 不 为 0, 所 以 零 标志 ZF 二 0; 加 法 器 最 高 位 向 前 
的 进位 C, 为 1。 

(3) [zx 一 7] 一 [z]# 十 [一 妇 # 一 10111100B 十 01010000B== (1) 00001100B= 二 0CH, 最 
高 位 前 面 的 一 位 1 被 丢弃 ,因此 ,寄存 器 DD 中 的 内 容 为 0CH, 对 应 的 真 值 为 十 12, 结 果 正 确 。 
两 个 加 数 的 符号 位 相 异 一 定 不 会 溢出 ,因此 溢出 标志 OF 为 0, 说 明 寄存 器 D 中 的 内 容 是 真 
正 的 结果 ;结果 的 第 一 位 0 为 符号 标志 SFE, 表 示 结 果 为 正 数 ;因为 结果 不 为 0, 所 以 零 标志 
ZF 二 0; 加 法 器 最 高 位 向 前 的 进位 C, 为 1 。 

(4) 若 将 加 法 器 最 高 位 的 进位 C, 作为 进位 标志 CF , 则 无 法 直接 根据 CF 的 值 判断 两 
个 带 符号 整数 的 大 小 ,因此 带 符号 加 减 运算 中 不 考虑 CF 标志 

9. 某 计算 机 标志 寄存 器 包含 4 个 标志 位 : CF- 进 / 借 位 标志 ， ;OF- 洲 出 标志 ;SF- 符 号 标 
志 ;ZF 零 标志 。 请 说 明 在 无 符号 数 和 带 符号 整数 两 种 情况 下 ,以 下 各 种 比较 运算 的 逻辑 判 
断 表达 式 。 

(1) 等 于 ; (2) 大 于 ; (3) 小 于 ; (4) 大 于 等 于 ; (5) 小 于 等 于 。 

【分 析 解 答 】 

要 比较 两 个 数 的 大 小 ,通常 对 这 两 个 数 先 作 减 法 ,根据 相 减 的 结果 生成 相应 的 标志 位 
最 后 根据 标志 位 判断 大 小 。 在 无 符号 数 相 减 时 ,一 般 不 考虑 SF 和 OF 标志 ;在 带 符 号 整数 
相 减 时 ,一 般 不 考虑 CF 标志。 假设 被 减 数 的 机 咒 数 为 处, 减 数 的 机 器 数 为 了 , 则 在 加 法 器 
中 计算 两 数 的 差 时 ,计算 公式 为 X 一 了 二 处 十 (一 了 )# 。 以 下 举 两 个 例子 来 说 明 。 假 定 X= 
1001B,Y 了 二 1100B, 则 在 4 位 加 法 器 中 执行 以 下 运算 : 1001B 一 1100B 二 1001B 十 0100B= 二 (0) 
1101B。 若 是 无 符号 数 比较 , 则 是 9 和 12 相 比 ,显然 ,ZF==0,CF=1; 若 是 带 符 号 整数 ( 补 码 
表示 ), 则 是 一 7 和 一 4 比较 ,显然 ,ZF==0,OF==0,SF==1。 假 定 X==1001B,Y 二 0100B, 则 在 
4 位 加 法 器 中 执行 以 下 运算 : 1001B 一 0100B= 二 1001B 十 1100B 二 (1)0101B。 若 是 无 符号 数 
比较 , 则 是 9 和 4 相 比 ,显然 ,ZF 二 0,CF=0; 若 是 带 符 号 整数 , 则 是 一 7 和 4 比较 ,显然 ， 
ZF=0,OF=1,SF=0。 

以 下 分 别 说 明 无 符号 数 和 带 符号 整数 两 种 情况 下 各 种 比较 运算 的 逻辑 判断 表达 式 。 

a. 无 符号 数 情况 

(1) 等 于 : 相 减 后 结果 为 0, 即 F= ZF。 

(2) 大 于 : 没有 借 位 且 相 减 后 不 为 0, 即 F=CF 十 ZF。 

C3) 小 于 : 有 借 位 且 相 减 后 不 为 0, 即 F=CF .2F。 

(4) 大 于 等 于 : 没有 借 位 或 相 减 后 结果 为 0, 即 F=CF 十 ZF。 

(5) 小 于 等 于 : 有 借 位 或 相 减 后 结果 为 0, 即 F=CF 十 ZF。 

b. 带 符号 整数 情况 

(1) 等 于 : 相 减 后 结果 为 0, 即 下 一 ZF。 

C2) 大 于 : 结果 不 为 0, 且 不 溢出 时 为 正 ,溢出 时 为 负 。 即 F=2ZF. (SF@DOR)，。 

(3) 小 于 : 结果 不 为 0, 且 不 溢出 时 为 负 , 溢 出 时 为 正 。 即 F=ZF. (SF@OF)。 

(4) 大 于 等 于 : 结果 为 0, 或 者 ,不 溢出 时 为 正 , 溢 出 时 为 负 。 即 FZF 十 (SF@DORD)。 

《5) 小 于 等 于 : 结果 为 0, 或 者 ,不 溢出 时 为 负 , 溢 出 时 为 正 。 即 上 = 一 ZF 十 CSFOP) 。 
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10. 填写 表 3. 3 ,注意 对 比 无 符号 数 和 带 符号 整数 的 乘法 结果 ,以 及 截断 操作 前 、 后 的 
表 3.3 题 10 用 表 


ZXy( 截 断后 ) 
模式 
机 器 数 值 
无 符号 数 
二 进 制 补 码 
无 符号 数 
二 进 制 补 码 
无 符号 数 
二 进 制 补 码 
【分 析 解 答 】 
根据 无 符号 数 乘法 运算 和 补 码 乘法 运算 算法 ,填写 表 3. 4。 
表 3.4 题 10 填 入 结果 后 的 表 
ZX y( 截 断 前 ) ZX y( 截 断后 ) 
模式 
机 器 数 值 机 器 数 值 
无 符号 数 001100 12 100 4 
二 进 制 补 码 111100 | 一 4 100 一 4 
无 符号 数 000111 7 111 7 
二 进 制 补 码 111111 一 1 111 一 1 
无 符号 数 110001 49 001 1 
二 进 制 补 码 000001 十 1 001 十 1 


对 表 3.4 中 结果 分 析 如 下 : @ 四 两 个 数 作为 无 符号 数 进行 乘法 运算 和 作为 带 符号 整数 进 
行 乘法 运算 时 , 因为 其 所 用 的 乘法 算法 不 同 , 所 以 ,乘积 的 机 器 数 可 能 不 同 ; @ 对 于 位 科 
法 运算 ,无论 是 无 符号 数 乘法 还 是 带 符号 整数 乘法 , 若 截取 2n 位 乘积 的 低 n 位 作为 最 终 的 
乘积 , 则 都 有 可 能 结果 溢出 , 即 ”位 数字 无 法 表示 正确 的 乘积 。 表 中 给 出 的 例子 中 ,虽然 带 
符号 整数 乘积 截断 后 都 没有 发 生 溢出 ,但 实际 上 还 是 存在 溢出 的 情况 ,例如 ,011BX011B= 
001001B, 截 断后 011 BX011B=001B, 显 然 截 断后 的 结果 游 出 。 

11. 考虑 以 下 C 语言 程序 代码 : 

int funcl(unsigned short si) 

{ 


return (si* 256); 


} 


和 运 划 广 法 和 运 茎 剖 件 


int func2(unsigned short si) 
{ 
return (si/256); 
} 
int func3(unsigned short si) 
{ 
return (((short) si* 256)/256); 
} 
int func4(unsigned short si) 
{ 
return (short) ((si* 256)/256); 
} 
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请 回答 下 列 问题 : 

(1) 假设 计算 机 硬件 不 提供 乘除 运算 功能 ,能 否 用 移 位 运算 实现 上 述 函 数 功 能 ?函数 
funcl\func2、func3 和 func4 得 到 的 结果 各 有 什么 特征 ? 

(2) 填写 表 3. 5( 要 求 机 器 数 用 十 六 进 制 表示 ), 并 对 表 中 的 “异常 ?数据 进行 分 析 。 


表 3.5 题 11 用 表 


(3) 对 于 函数 funcl 来 说 ,用 一 位 乘 运算 所 花 的 时 间 开 销 大 约 是 用 移 位 运算 的 多 少 倍 ? 
对 于 函数 func2 来 说 ,用 不 恢复 余数 除法 所 花 的 开销 大 约 是 用 移 位 运算 的 多 少 倍 ? 

【分 析 解 答 】 

(1) 因为 256=2 ,所 以 上 述 函 数 中 的 乘 、 除 运算 可 以 分 别 用 左右 移 运 算 来 实现 。 可 用 
“ 左 移 8 位 ”代替 “ 乘 256” 的 操作 ,用 “ 右 移 8 位 代替“ 除 以 256” 的 操作 。func1(si) 相 当 于 将 
si 逻辑 左 移 8 位 ,结果 的 最 后 8 位 都 为 0;func2(s 让 相当 于 将 si 逻辑 右 移 8 位 ,结果 的 范 韦 
在 0~255 之 间 ;func3(s 引 相当 于 将 si 先 算术 左 移 8 位 ,再 算术 右 移 8 位 ,所 以 结果 的 范 上 
在 一 128 和 127 之 间 ;func4(s 引 相当 于 将 si 先 逻 辑 左 移 8 位 ,再 逻辑 右 移 8 位 ,最 后 以 带 符 
号 整数 类 型 返回 。 因 为 最 后 是 逻辑 右 移 ,高 位 补 0, 所 以 ,返回 的 总 是 正 数 ,结果 的 范围 在 0 
到 255 之 间 。 

(2) 函数 funcl、func2、func3 和 func4 的 执行 结果 填 表 3. 6。 
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表 3.6 题 11 填 入 结果 后 的 表 


si func2(si) func3(si) func4Csi) 


机 器 数 
007FH 


0080H 


00FFH 


0100H 


FFFFH 


上 述 表 3.6 中 ,加 粗 数据 是 一 些 “ 异 常 ? 结 果 。 当 si 二 256 时 ,由 于 256X si 二 65536, 因 
此 用 16 位 无 符号 数 无 法 表示 实际 结果 ,导致 funcl(si func3(sD 和 func4(s 站 都 为 0; 同 样 ， 
当 5 一 65535 时 ,由 于 256Xs 溢出 ,导致 funcl\func3 和 func4 的 函数 值 出 现 了 “异常 ” 结 
果 ; 当 si 二 128 和 si 二 255 时 ,由 于 截断 低 16 位 乘积 得 到 的 第 一 位 (符号 位 ) 为 1, 因此 再 进行 
算术 右 移 时 高 位 补 了 8 位 1, 导致 func3 的 函数 值 “ 游 出”, 出 现 了 “异常 ”结果 。 

(3) 用 移 位 操作 代替 乘 、 除 运算 ,其 程序 执行 时 间 会 大 大 减少 。 采 用 桶 形 移 位 器 进行 移 
位 时 ,移动 任何 位 数 都 只 要 一 次 移 位 操作 。 假 定 一 次 移 位 操作 所 用 时 间 和 一 次 加 / 减 运算 时 
间 一 样 , 都 是 一 个 时 钟 周期 T, 那 么 ,对 于 函数 funcl, 采 用 一 位 乘法 器 时 ,两 个 16 位 数 相 乘 
的 运算 所 需 循环 次 数 为 16, 每 个 循环 内 进行 “判断 -加 法 - 右 移 ”操作 ,其 中 判断 操作 是 控制 器 
在 送出 控制 信号 之 前 进行 的 ,无 须 一 个 专门 的 时 钟 周 期 来 实现 ,因此 16 位 乘法 运算 所 用 时 
间 大 约 为 32T, 由 此 可 知 ,采用 一 位 乘法 运算 ,函数 funcl 的 执行 时 间 大 约 是 采用 移 位 运算 
的 32 倍 。 对 于 函数 func2, 采 用 不 恢复 余数 法 时 ,两 个 16 位 数 相 除 时 所 需 循环 次 数 为 16， 
循环 内 有 “判断 - 左 移 ( 上 商 )- 加 / 减 ”操作 ,所 用 时 间 大 约 为 32T, 因 此 是 采用 移 位 运算 的 32 
售 左右 。 

12. 若 一 次 加 法 需要 lns, 一 次 移 位 需要 0. 5ns。 请 分 别 估算 用 一 位 乘法 、 两 位 科 法 、 基 
于 CRA 的 阵列 乘法 、 基 于 CSA 的 阵列 乘法 4 种 方式 计算 两 个 8 位 无 符号 二 进 制 数 乘积 时 
所 需要 的 时 间 。 

【分 析 解 答 】 

一 位 乘法 需 8 次 右 移 ,8 次 加 法 ,共计 12ns; 二 位 乘法 需 4 次 右 移 ,4 次 加 法 ,共计 6ns; 
对 于 基于 CRA 的 阵列 乘法 ,每 一 级 部 分 积 不 仅 依赖 于 上 一 级 部 分 积 ,还 依赖 于 上 一 级 最 终 
的 进位 ,而 每 一 级 进位 又 是 串 行进 行 的 ,所 以 最 长 的 路 径 总 共 经 过 了 8 十 2X (8 一 1) 一 22 个 
单元 节点 (细胞 模块 ) ,假定 经 过 每 个 单元 节点 所 花 时 间 平 均 为 0. 5ns, 则 共计 大 约 1lns; 对 
于 基于 CSA 的 阵列 乘法 ,本 级 进位 与 本 级 和 能 同时 传送 到 下 一 级 , 且 同 级 部 分 积 之 间 互 不 
依赖 ,因此 只 需 进 行 OON) 次 简单 加 法 ( 即 半 加 或 全 加 ) 运 算 ,假定 简 单 加 法 时 间 为 8 位 加 法 
器 时 间 的 一 半 , 则 一 共 大 约 为 tns。 

13. 已 知 xz 一 10,y 一 一 6, 采 用 6 位 机 器 数 表示 。 请 按 如 下 要 求 计算 ,并 把 结果 还 原 成 
真 值 。 

(1) 求 [z 十 y]#，[X 一 yj] 补 。 

(2) 用 原 码 一 位 乘法 计算 [xX yj]m。 
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(3) 用 补 码 一 位 乘法 (Booth 算法 ) 计 算 [zXy ja。 

(4) 用 MBA( 基 -4 布 斯 乘法 计算 [zX yj]#。 

(5) 用 不 恢复 余数 法 计算 [Lz/yjm 的 商 和 余数 。 

【分 析 解 答 】 

先 将 xz 和 y 转换 为 二 进 制 数 。z=10= 十 01010B,y= 一 6 二 一 00110B。 

(1) [zjs =001010B,[Ly]# =111010B,[—yj#=000110B。 [zy]#=[zj# 二 [yj# = 
001010B 十 111010B 二 000100B, 因 此 ,zx 十 y= 二 4。[z 一 y]# 王 [zj] 十 [一 yj 二 001010B 十 
000110B==010000B, 因 此 ,zx 一 y= 十 16。 

(2) [zjm 二 001010B,[yjm 二 100110B。 将 符号 和 数值 部 分 分 开 处 理 。 乘 积 的 符号 为 
0 田 1=1, 数 值 部 分 采用 无 符号 数 乘法 算法 计算 01010BX 00110B 的 乘积 。 原 码 一 位 乘法 过 
程 描 述 如 下 : 初始 部 分 积 为 0, 在 乘积 寄存 器 前 增加 一 个 进位 位 。 每 次 循环 首先 根据 乘 数 寄 
存 器 中 最 低位 决定 十 X 还 是 十 0( 这 里 X 为 被 除数 001010B) ,然后 将 得 到 的 新 进位 、 新 部 分 
积 和 乘 数 寄存 器 中 的 部 分 乘 数 一 起 逻辑 右 移 一 位 。 共 循环 5 次 ,最 终 得 到 一 个 10 位 无 符号 
数 表示 的 冬 积 0000111100B。 所 以 ,[zXwyj] 和 二 10000111100B, 因 此 ,zxX y= 一 60。 若 结果 
取 6 位 原 码 , 则 因为 高 5 位 00001 是 一 个 非 零 数 , 所 以 结果 洲 出 , 即 [zX yjm 了 111100B。 验 
证 : 6 位 原 码 的 表示 范围 为 一 31 一 十 31, 显然 乘积 一 60 不 在 其 范围 内 ,结果 应 该 溢出 。( 过 
程 略 ) 

(3) [zi 一 001010B,[ 一 zj 一 110110B,[y] 王 111010B。 采 用 Booth 算法 时 ,符号 和 
数值 部 分 一 起 参加 运算 ,最初 在 乘 数 后 面 添 0, 初 始 部 分 积 为 0。 每 次 循环 先 根据 乘积 寄存 
器 中 最 低 两 位 决定 执行 十 X、 一 X 还 是 十 0 操作 (这 里 X 为 被 乘 数 001010B) ,然后 将 得 到 的 
新 的 部 分 积 和 乘 数 寄存 髓 中 的 部 分 乘 数 一 起 算术 右 移 一 位 。 一 XX 采 用 十 [一 xj# 的 方式 进 
行 。 共 循环 6 次 。 最 终 得 到 一 个 12 位 补 码 表示 的 乘积 1111 1100 0100B, 所 以 ,[zXyj# 二 
1111 1100 0100B, 因 此 ,zXy 王 一 60。 若 结果 取 6 位 补 码 , 则 根据 乘积 低 6 位 000100 的 符 
号 位 为 0, 而 高 6 位 为 111111, 不 等 于 全 0, 说 明 结 果 溢出 。 即 [xX yj] 了 关 000100B。 验 证 : 6 
位 补 码 的 表示 范围 为 一 ?2 一 十 31, 显 然 一 60 不 在 其 范围 内 ,结果 应 该 溢出 。( 过 程 略 》 

(4) [zj 和 一 001010B,[ 一 zj 一 110110B,[y]# 王 111010B。 采 用 MBA 算法 时 ,符号 和 
数值 部 分 一 起 参加 运算 ,最初 在 乘 数 后 面 添 0, 初 始 部 分 积 为 0, 并 在 部 分 积 前 加 一 位 符号 位 
0。 每 次 循环 先 根据 乘积 寄存 器 中 最 低 3 位 决定 执行 十 X、 十 2X、 一 X、 一 2X 还 是 十 0 操作 
(这 里 义 为 被 乘 数 001010B) ,然后 将 得 到 新 的 部 分 积 和 乘 数 寄存 器 中 的 部 分 乘 数 一 起 算术 
右 移 两 位 。 一 X 和 一 2X 分 别 采 用 十 [一 zj] 让 和 十 2[ 一 z]# 的 方式 进行 。 共 循环 3 次 。 最 终 
得 到 一 个 12 位 补 码 表示 的 乘积 1111 1100 0100B, 所 以 ,[zX yj 二 1111 1100 0100B, 因 此 ， 
ZX2y 一 一 60。( 过 程 略 ) 

(5) [zj 一 001010B,[yjm 一 100110B。 将 符号 和 数值 部 分 分 开 处 理 。 商 的 符号 为 0 中 
1 二 1, 数 值 部 分 采用 无 符号 数 除法 算法 计算 01010B 和 00110B 的 商 和 余数 。 无 符号 数 不 恢 
复 余 数 除法 过 程 描述 如 下 : 初始 中 间 余 数 为 0000 0001 0100B, 其 中 ,最 高 位 为 添加 的 符号 
位 ,用 于 判断 余数 是 否 大 于 等 于 0; 最 后 一 位 0 为 第 一 次 上 的 商 , 该 位 商 只 是 用 于 判断 结果 
是 否 溢出 ,不 包含 在 最 终 的 商 中 。 因 为 结果 肯定 不 溢出 ,所 以 该 位 商 可 以 直接 上 0, 并 先 做 
一 次 一 了 操作 得 到 第 一 次 中 间 余 数 (这 里 了 为 被 除数 000110B) ,然后 进入 循环 。 每 次 循环 
首先 将 中 间 余 数 和 商 一 起 左 移 一 位 ,然后 根据 上 一 次 上 的 商 (或 余数 的 符号 ) 决 定 执 行 十 了 
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还 是 一 Y 操作 ,以 得 到 新 的 中 间 余 数 ,最 后 根据 中 间 余 数 的 符号 确定 上 商 为 0 还 是 1。 一 了 
采用 十 [一 yj# 的 方式 进行 。 整 个 循环 内 执行 的 要 点 是 “ 正 、1、 减 ; 负 、0、 加 ”。 共 循环 5 次 。 
最 终 得 到 一 个 6 位 无 符号 数 表示 的 商 0 00001B 和 余数 00100B, 其 中 第 一 位 商 0 必须 去 掉 ， 
添上 符号 位 后 得 到 最 终 的 商 的 原 码 表示 为 1 00001B, 余 数 的 原 码 表示 为 0 00100B。 因 此 ， 
Z/y 的 商 为 一 1, 余 数 为 4。( 过 程 略 ) 

14. 假设 浮 点 数 的 阶 码 和 尾数 均 采用 补 码 表示 , 且 位 数 分 别 为 5 位 和 7 位 ( 均 含 2 位 符 
号 位 , 即 变形 补 码 )。 若 有 两 个 数 zx 一 2 X15/16,y 二 2*X3/8, 要 求 用 浮 点 加 法 计算 z 十 y 的 
最 终结 果 。 

【分 析 解 答 】 

先 将 两 个 数 的 尾数 部 分 变 成 分 母 为 32 的 形式 , 即 x 二 2? X30/32,y 二 25 X12/32, 得 到 之 
和 y 的 浮 点 数 表示 为 xz: 00.11110B,00111B、y: 00.01100B,00101B; 然 后 进行 浮 点 数 加 / 减 
运算 。y 对 阶 后 为 00. 00011B, 00111B, 因此 尾数 相 加 结果 为 00. 11110B 十 00. 00011B= 
01. 00001B。 该 尾数 形式 需要 右 规 , 即 尾数 右 移 一 位 , 若 采 用 ?0 舍 1 人? 舍 人 规则 , 右 规 后 尾 
数 为 00. 10001B, 阶 码 加 1 后 为 01000B, 因 此 , 右 规 后 结果 为 00. 10001B,01000B。 最 后 对 
该 结果 进行 溢出 判断 ,显然 , 阶 码 的 两 个 符号 位 不 同 , 故 结果 溢出 。 

15. 假设 有 两 个 实数 zx 和 yz 一 一 68,y 一 一 8.25 ,它们 被 定义 为 float 型 变量 ,x 和 y 分 
别 存 放 在 寄存 器 A 和 B 中 。 另 外 ,还 有 两 个 寄存 器 C 和 DD。A、B、C.D 都 是 32 位 寄存 器 。 
请 回答 下 列 问 题 (要 求 最 终 用 十 六 进 制 表示 二 进 制 序列 ) 。 

(1) 寄存 器 A 和 B 中 的 内 容 分 别 是 什么 ? 

(2) 车 z 和 相 加 后 的 结果 存放 在 寄存 器 C 中 , 则 寄存 器 C 中 的 内 容 是 什么 ? 

(3) 车 z 和 y 相 减 后 的 结果 存放 在 寄存 器 D 中 , 则 寄存 器 D 中 的 内 容 是 什么 ? 

【分 析 解 答 】 

通常 float 型 数据 用 IEEE 754 单 精 度 浮 点 数 格式 表示 。 

(Dz 68 1000100B 1. 0001BX2, 因 此 ,符号 位 为 1, 阶 码 Ex 为 1000 
0101B ,尾数 小 数 部 分 为 000 1000 0000 0000 0000 0000B, 淫 点数 表示 形式 为 1 1000 0101 
000 1000 0000 0000 0000 0000B, 十 六 进 制 形式 为 C288 0000H。y== 一 8. 25 二 一 1000. 01B 
一 一 1. 00001BX2s ,因此 ,符号 位 为 1, 阶 码 Ey 为 1000 0010B, 尾 数 小 数 部 分 为 000 0100 
0000 0000 0000 0000B, 浮 点 数 表示 形式 为 1 1000 0010 000 0100 0000 0000 0000 0000B, 十 
六 进 制 形式 为 C104 0000H。 因 此 , 寄存 器 A 和 B 中 的 内 容 分 别 是 C288 0000H、 
C104 0000H。 

《2) 两 个 淫 点 数 相 加 的 步骤 如 下 。 

Q@ 对 阶 。Ez 一 1000 0101B, Ey 二 1000 0010B,[AE]# = 二 Ez 十 [一 Eyj# 二 1000 0101B 十 
0111 1110B 一 0000 0011B,AE 一 十 3, 所 以 对 y 进行 对 阶 。 对 阶 后 ,y 王 一 0. 00100001BX2s。 
即 y 的 浮 点 数 表示 为 1 1000 0101 (0) 001 0000 1000 0000 0000 0000B。 

加 尾数 相 加 。z 的 尾数 为 一 1. 000 1000 0000 0000 0000 0000B, y 的 尾数 为 
一 0. 001 0000 1000 0000 0000 0000B。 原 码 加 法 运算 规则 为 “ 同 号 求 和 , 异 号 求 差 *。 因 两 
数 符 号 相同 , 故 做 加 法 ,结果 为 一 1. 001 1000 1000 0000 0000 0000B。 因 此 ,z 十 y 的 结果 为 
一 1.001 1000 1BX 2 ,符号 位 为 1, 尾 数 小 数 部 分 为 001 1000 1000 0000 0000 0000B, 阶 码 为 
127 十 6 二 1000 0101B, 浮 点 数 表示 为 1 1000 0101 001 1000 1000 0000 0000 0000B ,转换 为 十 
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六 进 制 形式 为 C298 8000H。 因 此 ,寄存 器 C 中 的 内 容 是 C298 8000H。 

《3) 两 个 浮 点 数 相 减 的 步骤 同 加 法 ,对 阶 的 结果 也 一 样 , 只 是 尾数 相 减 。 原 码 减 法 运算 
规则 为 “ 同 号 求 差 , 异 号 求 和 ”。 因 两 数 符号 相同 , 故 做 减法 。 数 值 部 分 由 被 减 数 加 上 减 数 的 
补 码 ( 各 位 取 反 ,末尾 加 1) 得 到 , 即 : 

1. 000 1000 0000 0000 0000 0000 

十 “1. 110 1111 1000 0000 0000 0000 

1 0. 111 0111 1000 0000 0000 0000 
最 高 数值 位 产生 进位 ,表明 所 得 数值 位 正确 , 且 结 果 的 符号 取 被 减 数 的 符号 , 即 结果 为 负数 。 
因此 ,z 减 y 的 结果 为 一 0.11101111BX2 一 一 1.1101111BX25。 即 符号 位 为 1, 尾数 小 数 
部 分 为 110 1111 0000 0000 0000 0000B, 阶 码 为 127 十 5 一 1000 0100B, 浮 点 数 表示 为 1 1000 
0100 110 1111 0000 0000 0000 0000B, 转 换 为 十 六 进 制 形式 为 C26F 0000H。 因 此 ,寄存 器 

DD 中 的 内 容 是 C26F 0000H。 

16. 在 IEEE 754 浮 点 数 运算 中 , 当 结 果 的 尾数 出 现 什 么 形式 时 需要 进行 左 规 ? 什么 形 
式 时 需要 进行 右 规 ? 如 何 进行 左 规 ? 如 何 进 行 右 规 ? 

【分 析 解 答 】 

(1) 对 于 结果 为 土 1x. zz…z 的 情况 ,需要 进行 右 规 。 即 尾数 M, 右 移 一 位 , 阶 码 玉 加 
1。 右 规 操 作 可 以 表示 为 MAM, X21!, EE 一 Es 十 1。 右 规 时 注意 以 下 两 点 : (a) 尾 数 右 移 
时 ,最 高 位 “1? 被 移 到 小 数 点 前 一 位 作为 隐藏 位 ,最 后 一 位 移出 时 ,要 考虑 伟人 ;(b) 阶 码 加 1 
时 ,直接 在 末 位 加 1。 

《2) 对 于 结果 为 土 0. 00…01z…z 的 情况 ,需要 进行 左 规 。 即 尾数 M 逐次 左 移 , 阶 码 EE 
逐次 减 1, 直 到 将 第 一 位 “1? 移 到 小 数 点 左边 。 假 定 有 为 结果 中 “ 士 ? 和 左边 第 一 个 1 之 间 连 续 
0 的 个 数 , 则 左 规 操作 可 以 表示 为 M, 一 MX2* ,EE,<-E 一 &。 左 规 时 注意 以 下 两 点 : (a) 尾 数 左 
移 时 数值 部 分 最 左 & 个 0 被 移出 ,因此 ,相对 来 说 ,小 数 点 右 移 了 位 。 因 为 进行 尾数 相 加 时 ， 
默认 小 数 点 位 置 在 第 一 个 数值 位 ( 即 隐藏 位 ?之 后 ,所 以 小 数 点 右 移 上 位 后 被 移 到 了 第 一 位 1 
后 面 ,这 个 1 就 是 隐藏 位 。(b) 执 行 一, 一 k 时 ,每 次 都 在 末 位 减 1, 一 共 减 上 次 。 

17. 在 IEEE 754 浮 点 数 运算 中 ,如 何 判断 浮 点 运算 的 结果 是 否 溢 出 ? 

【分 析 解 答 】 

因为 尾数 溢出 时 ,可 通过 右 规 操 作 进行 纠正 。 所 以 , 浮 点 运算 结果 是 否 溢 出 ,并 不 以 尾 
数 溢 出 来 判断 ,而 主要 看 阶 码 是 否 溢出 。 在 进行 规格 化 .尾数 舍 人 和 浮 点 数 的 乘 / 除 运算 过 
程 中 ,都 需要 对 阶 码 进行 加 、 减 运算 ,因此 在 这 些 操 作 过 程 中 ,可 能 会 发 生 阶 码 上 溢 或 阶 码 下 
溢 。 阶 码 上 溢 时 ,说 明 结 果 的 数值 太 大 ,无 法 表示 ,是 真正 的 溢出 ; 阶 码 下 溢 时 ,说 明 结果 数 
值 太 小 ,可 以 将 结果 近似 为 0。 

18. 假设 浮 点 数 格式 为 : 阶 码 是 4 位 移 码 , 偏 置 常数 为 8, 尾数 是 6 位 补 码 (采用 双 符 号 
位 ) ,用 浮 点 运算 规则 分 别 计算 在 不 采用 任何 附加 位 和 采用 2 位 附加 位 (保护 位 、 舍 入 位 ) 的 
情况 下 以 下 各 式 的 值 (假定 对 阶 和 右 规 时 采用 就 近 伟 人 到 偶数 方式 ) 。 


(1) (15/16) X2’+(2/16) X25 (2) (15/16) X2’—(2/16) X25 
C3) (15/16) X25+(2/16) X27 (4) (15/16) X25—(2/16)X2" 
【分 析 解 答 】 


将 上 述 各 式 中 的 数据 用 相应 的 变量 A、B、C、D 代替。 
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A=(15/16) X2’=0.1111BX2?’,[Alx =00. 1111B,1111B, 

B=(2/16) X25=0.0010BX2;=0.1000BX23,[B]s =00.1000B,1011B, 

C=(15/16) X25=0.1111BX2,[C]x =00.1111B,1101B, 

D=(2/16) X2’=0.0010BX2’=0. 1000BX25,[D]x =00.1000B,1101B, 

不 采用 任何 附加 位 时 的 计算 结果 如 下 。 

(1) 计算 A 十 B: [AE]# = 二 [Es] 十 [一 [Esjg$j]# 二 1111B 十 0101B= 二 0100B(mod 24), 因 
此 AE==4, 故 需 对 B 进行 对 阶 , 因 为 不 采用 任何 附加 位 ,所 以 ,B 的 尾数 右 移 4 位 后 直接 合 
去 1000, 又 因为 “1000” 是 中 间 值 ,因此 尾数 取 偶 数 00. 0000B, 故 对 阶 后 结果 为 
LBjx 二 00.0000B,1111B。 由 于 B 的 尾数 为 0, 因 此 ,LA 十 Bjx = 二 [Ajx 二 00.1111B,1111B。 
故 A 十 B=A=(15/16) X27。 

(2) 计算 4 一 B: 对 阶 结 果 与 (1) 相 同 , 故 [A 一 BlJs = 二 [Ajx ==00.1111B,1111B。 故 A 一 
B=A=(15/16) X2’。 

(3) 计算 C 十 D: [AE]# = 二 [Ecj]g 十 [一 [Epj]$j]# 二 1101B 十 0011B= 二 0000BC(mod 24), 因 
此 AE= 0, 故 无 须 对 阶 ，。 尾 数 直 接 加 : [Mc ]# 十 [Mp |]# 三 00. 1111B 十 00. 1000B= 
01.0111B, 因 为 补 码 的 两 个 符号 位 不 同 , 所 以 尾数 溢出 ,需要 右 规 。 右 规 时 需 对 尾数 进行 合 
入 , 阶 码 加 1。 全 和 最 后 一 位 的 “1” 是 中 间 值 ,因此 尾数 取 侦 数 00. 1100B, 阶 码 1101B 加 1 
后 为 1110B, 所 以 ,[C 十 D]# 二 00.1100B,1110B。 故 C 十 D=(12/16) X2s。 

(4) 计算 C 一 D: 对 阶 结果 与 (3 相同 。 尾 数 直接 减 : [Mcj]# 十 [一 Moj# 二 00.1111B 十 
11.1000B=00.0111B。 显 然 , 尾 数 需 左 规 。 左 规 时 ,尾数 左 移 一 位 , 阶 码 减 1。 因 此 ,最 终 必 
数 为 00. 1110B, 阶 码 1101B 减 1 后 为 1100B。 因 此 ,[C 一 Djx 二 00. 1110B, 1100B, 故 
C 一 D=(14/16)X24。 

采用 两 位 附加 位 时 的 计算 结果 如 下 。 

(1) 计算 A 十 B: [AE]=[LEA]# 十 [一 [LEs]#]# 王 1111B 十 0101B=0100BCmod 24) , 因 
此 AE=4, 故 需 对 B 进行 对 阶 ,对 阶 后 结果 为 LBj; 三 00. 0000 10B,1111B。 尾 数 相 加 结果 
为 [Mi ]# 十 [LMsj# 三 00.1111 00B 十 00. 0000 10B 二 00. 1111 10B, 因 此 ,[A 十 Bjxs 为 
00. 1111 10B,1111B。 最 后 对 尾数 附加 位 10 进行 合 入 ,因为 舍 和 人 的 是 中 间 值 ,所 以 尾数 结果 
强迫 为 偶数 , 即 尾数 末 位 加 1, 得 尾数 为 01. 0000B, 因 此 ,尾数 需 右 规 为 00. 1000B, 同 时 , 阶 
码 1111B 加 1 产生 阶 码 上 溢 , 因 而 导致 结果 溢出 。 因 此 ,4 十 B 的 结果 溢出 。 

(2) 计算 A 一 B: 对 阶 结果 与 (1) 相同 。 尾 数 相 减 结果 为 LMa Jj# 十 [一 Msj# 王 
00. 1111 00B 十 11. 1111 10B 一 00. 1110 10B, 因 此 ,[A 一 Bjx 二 00.1110 10B,1111B。 最 后 对 
尾数 附加 位 10 进行 全 入, 因为 舍 人 的 是 中 间 值 ,所 以 尾数 结果 强迫 为 偶数 ,得 尾数 为 
00.1110B, 因 此 ,[A 一 Bjx 二 00.1110B,1111B。 故 A 一 B==(14/16) X2’。 

(3) 计算 C 十 D: [AE]# 二 [Ecl]g 十 [一 LEp]g#j]# 二 1101B 十 0011B= 二 0000B(mod 2*), 因 
此 AE 一 0, 故 无 须 对 阶 。 尾 数 直接 加 : LMcj# 十 LMp]# 一 00. 1111 00B 十 00. 1000 00B= 
01. 0111 00B, 因 为 补 码 的 两 个 符号 位 不 同 , 所 以 尾数 溢出 ,需要 右 规 。 右 规 时 需 对 尾数 进行 
舍 人 , 阶 码 加 1。 舍 人 的 “100” 是 中 间 值 ,因此 尾数 取 偶 数 00. 1100B, 阶 码 1101B 加 1 后 为 
1110B, 所 以 ,[C 十 Djx 二 00.1100B,1110B。 故 C 十 D==(12/16) X2s。 

(4) 计算 C 一 D: 对 阶 结果 与 (3) 相 同 。 尾 数 直接 减 : [Mc J 十 [一 MpjJ# 二 00.1111 00B 十 
11. 1000 00B 一 00.0111 00B。 显 然 , 尾 数 需 左 规 。 左 规 时 ,尾数 左 移 一 位 , 阶 码 减 1。 因 此 ， 
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最 终 尾数 为 00.1110B, 阶 码 1101B 减 1 后 为 1100B。 因 此 ,[C 一 Dlx 二 00.1110B,1100B, 故 
C—D= (14/16) X2。 

19. 采用 IEEE 754 单 精 度 浮 点 数 格式 计算 下 列表 达 式 的 值 。 

(1) 0.75 十 (一 65. 25) (2) 0.75 一 (一 65. 25) 

【分 析 解 答 】 

z=0.75=0.11B=1. 1BX2-!,y=—65. 25 一 一 1000001. 01B 一 一 1. 00000101BX2s 。 
用 IEEE 754 单 精度 格式 表示 为 [zjx 一 0 01111110 10…0B,[y]z 王 1 10000101 000001010 
0B。 即 z 的 阶 码 EE, = 01111110B,zz 的 尾数 M, 二 0(1). 10…0B,y 的 阶 码 下 ,一 
10000101B,y 的 尾数 M, 二 1(1). 000001010…0B。 尾 数 M, 和 M, 的 小 数 点 前 面 有 两 位 ,第 
一 位 为 数 符 ,第 二 位 加 了 括号 ,是 隐藏 位 <1”。 以 下 是 机 器 中 浮 点 数 加 / 减 运算 过 程 (假定 保 
留 2 位 附加 位 : 保护 位 和 伟人 位 ) 。 

(1) 0.75 十 (一 65. 25) 

@ 对 阶 : [AE]# = 已 .十 [一 已 ,]# 王 0111 1110B 十 0111 1011B=1111 1001B(mod 2:)， 
AE= 一 7, 故 需 对 x 进行 对 阶 ,结果 为 E, 二 EE, 二 10000101B,M, 二 00.000000110…0 00B, 也 
即将 z 的 尾数 M, 右 移 7 位 ,符号 不 变 ,数值 高 位 补 0, 隐 藏 位 右 移 到 小 数 点 后 面 , 最 后 移出 
的 2 位 保留 作为 附加 位 ( 粗 体 字 部 分 ) 。 

@ 尾数 相 加 : M, = M. 十 M,=00. 000000110…0 00B 十 11. 000001010 …0 00B。 根 据 
原 码 加 /减法 运算 规则 ,得 Ms =11. 000000100…0 00B。 上 式 尾 数 中 最 左边 第 一 位 是 符号 
位 ,其 余 都 是 数值 部 分 ,尾数 最 后 两 位 是 附加 位 。 

@ 规格 化 : 根据 所 得 尾数 的 形式 ,数值 部 分 最 高 位 为 1, 所 以 不 需要 进行 规格 化 。 

@ 舍 人 : 将 结果 的 尾数 Ms 中 最 后 两 位 附加 位 舍 入 ,从 本 例 来 看 ,不 管 采用 什么 舍 人 
法 ,结果 都 一 样 ,都 是 把 最 后 两 个 0 去 掉 , 得 M, 二 11.000000100…0B。 

@ 溢出 判断 : 在 上 述 阶 码 计算 和 调整 过 程 中 ,没有 发 生 “ 阶 码 上 溢 ” 和 “ 阶 码 下 溢 ?” 的 
问题 。 

最 终结 果 为 EE 二 10000101B,M, 二 1(1). 00000010…0B, 即 一 1. 0000001BX2 一 一 64.5。 

(2) 0.75—(—65. 25) 

Q@ 对 阶 : 同上 述 (1) 中 对 阶 过 程 一 样 。 

@ 尾数 相 减 : MX 一 M. 一 M,=00.000000110…0 00b 一 11. 000001010…0 00B。 根 据 原 
码 加 /减法 运算 规则 ,得 M; 二 01. 00001000…0 00B。 

@ 规格 化 : 根据 所 得 尾数 的 形式 ,数值 部 分 最 高 位 为 1, 不 需要 进行 规格 化 。 

@ 舍 和 人: 把 结果 的 尾数 Ms 中 最 后 两 位 附加 位 舍 入 掉 , 得 M, 一 01.00001000…0B。 

@@ 溢出 判断 : 在 上 述 阶 码 计算 和 调整 过 程 中 ,没有 发 生 “ 阶 码 上 游 ” 和 “ 阶 码 下 溢 ” 的 
问题 。 

最 后 结果 为 Es 二 10000101 ,1M 二 0C1). 00001000…0B, 即 十 1.00001BX2s 一 十 66。 

20. 假定 十 进 制 数 用 8421 NBCD 码 表示 ,采用 十 进 制 加 法 运算 计算 下 列表 达 式 的 值 ， 
并 讨论 在 十 进 制 BCD 码 加 法 运算 中 如 何 判断 溢出 。 

(1) 234 十 567 (2) 548 十 729 

【分 析 解 答 】 

(1) 计算 234 十 567 时 ,两 个 加 数 分 别 是 0010 0011 0100B 和 0101 0110 0111B, 送 到 12 
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位 无 符号 加 法 器 中 得 到 和 为 0111 1001 1011B, 其 中 ,最 低 4 位 需 进 行 “ 十 6” 校 正 , 得 到 结果 
为 0111 1010 0001B, 此 时 ,中 间 4 位 又 需要 “十 6 校正 ,得 最 终结 果 为 1000 0000 0001B , 转 
换 为 十 进 制 数 为 801 。 

(2) 计算 548 十 729 时 ,两 个 加 数 分 别 为 0101 0100 1000B 和 0111 0010 1001B, 送 到 12 
位 无 符号 加 法 器 中 得 到 和 为 1100 0111 0001B, 最 高 4 位 和 最 低 4 位 需 “ 十 6 校正 ,得 到 低 12 
位 结果 为 0010 0111 0111B, 并 产生 进位 1, 因 而 结果 溢出 。 但 如 果 采 用 4 位 BCD 码 表示 ( 即 
在 16 位 加 法 器 中 运算 ), 则 结果 不 会 溢出 ,此 时 得 到 最 终 的 和 为 0001 0010 0111 0111B, 即 
十 进 制 数 1277 。 

21. 假定 十 进 制 数 用 8421 NBCD 码 表示 ,十 进 制 运 算 673 一 356 可 以 采用 673 加 上 
一 356 的 模 10 补 码 实现 。 画 出 实现 上 述 操作 的 3 位 十 进 制 数 的 BCD 码 减 法 运算 线路 。 

【分 析 解 答 】 

计算 673 一 356 时 , 先 通过 将 356“ 各 位 取 反 、 末 位 加 1” 得 到 一 356 的 模 10 补 码 表示 ,为 
0110 0100 0100B, 然 后 与 被 加 数 673 相 加 ,因此 ,无 符号 加 法 器 的 两 个 加 数 输入 端 分 别 为 
0110 0111 0011B 和 0110 0100 0100B。 这 样 加 法 器 的 输出 为 1100 1011 0111B, 其 中 高 4 位 
和 中 间 4 位 需 “ 十 6” 校 正 , 得 到 低 12 位 结果 为 0011 0001 0111B, 同时 产生 进位 1。 在 BCD 
码 减 法 运算 中 , 若 最 高 位 有 进位 , 则 说 明 结 果 为 正 ; 若 最 高 位 没有 进位 , 则 说 明 结果 为 负 , 需 
将 数值 部 分 “各 位 取 反 ,末尾 加 1”, 以 得 到 最 终结 果 。 因 此 ,本 题 结果 为 十 进 制 数 317。 

BCD 码 减 法 运算 电路 通常 在 BCD 码 加 法 器 基础 上 实现 ,可 在 第 二 个 加 数 输 入 端 加 一 
个 十 进 制 数 字 “ 求 补 ” 电 路 ,并 在 输出 端 处 增加 一 个 对 进位 进行 判断 和 对 结果 “ 求 补 ”的 电路 。 
实现 3 位 BCD 码 减 法 运算 的 电路 如 图 3. 1(a) 所 示 。 图 中 3 位 被 减 数 为 zazizo,3 位 减 数 为 
y% Yo， 结果 的 符号 为 s,s 二 0 表示 结果 为 正 数 ,s=1 表示 结果 为 负数 ,结果 的 数值 部 分 为 
zzx1xoo。“3 位 BCD 码 求 补 电路 ”如 图 3. 1(b) 所 示 , 通 过 “各 位 取 反 、 末 位 加 1” 得 到 补 码 。 
“一 位 BCD 码 取 反 电路 ?如 图 3.1(c) 所 示 , 通 过 “加 6 取 反 ?得 到 一 位 BCD 码 的 反 码 。 
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第 4 齐 
存储 器 分 层 体系 结构 


4.1 教学 目标 和 内 容 安排 


主要 教学 目标 : 

使 学 生 掌 握 构成 存储 器 分 层 体 系 结构 的 几 类 存储 器 的 工作 原理 和 组 织 形式 。 要 求学 生 
深刻 理解 程序 访问 局 部 性 的 意义 ,学 会 利用 时 间 局 部 性 和 空间 局 部 性 编写 高 效 的 程序 ;了 解 
指令 执行 过 程 中 访问 指令 和 访问 数据 的 整个 过 程 ,以 及 存储 访问 过 程 中 硬件 和 软件 的 分 工 
和 联系 ,并 深刻 理解 提高 各 种 访问 命中 率 的 意义 ;了 解 虚拟 存储 管理 的 必要 性 和 实现 思路 ， 
为 学 习 操作 系统 中 的 存储 管理 等 内 容 打 下 坚实 基础 。 

基本 学 习 要 求 : 

(1) 了 解 存储 器 的 各 种 分 类 方式 。 

(2) 了 解 如 何 构建 存储 器 的 层次 化 结构 。 

(3) 深刻 理解 程序 访问 的 局 部 化 特性 。 

(4) 熟 种 主 存 储 器 的 基本 逻辑 结构 。 

(5) 了 解 SRAM 和 DRAM 芯片 的 内 部 结构 。 

(6) 了 解 半导体 随机 存 取 存储 器 的 组 织 方式 。 

(7) 了 解 各 种 只 读 存 储 器 的 特点 。 

(8) 了 解 存储 器 芯片 扩展 技术 及 其 与 CPU 的 连接 方式 。 

(9) 了 解 加 快 在 储 访问 速度 的 几 种 措施 。 

(10) 了 解 多 体 交 叉 编 址 存储 器 的 基本 原理 。 

(11) 掌握 cache 的 基本 原理 与 实现 方式 ,包括 三 种 映射 方式 、 替 换算 法 、 写 策略 等 。 

(12) 理解 为 何 采用 虚拟 存储 管理 方式 。 

(13) 理解 什么 是 虚拟 地 址 和 虚拟 地 址 空间 。 

(14) 掌握 虚拟 地 址 向 物理 地 址 转 拉 的 基本 原理 与 实现 技术 。 

(15) 了 解 页 表 的 功能 和 页 表 项 的 内 容 。 

(16) 了 解 “ 缺 页 ”异常 的 发 现 和 处 理 过 程 。 

(17) 掌握 TLB( 快 表 ) 的 结构 和 实现 技术 。 

(18) 掌握 一 次 存储 访问 的 全 过 程 ,并 深刻 理解 在 此 过 程 中 硬件 与 软件 之 间 的 分 工 协作 
方式 。 
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本 章 主要 包含 3 个 核心 内 容 : 半导体 随机 访问 存储 器 、cache 和 虚拟 存储 器 ,并 阐述 了 
如 何以 这 3 个 核心 内 容 为 基础 ,构建 存储 器 的 层次 化 体系 结构 框架 。 

对 于 半导体 随机 访问 存储 器 ,可 以 按照 “记忆 单元 -~ 存储 阵列 -存储 器 芯片 -~ 存储 模块 
(内 存 条 ) 一 存储 器 ?的 顺序 ,采用 由 点 到 面 的 组 织 方式 ,着 重 讲 清楚 SRAM 和 DRAM 两 类 
存储 器 的 结构 特点 和 用 途 , 以 及 存储 芯片 的 扩展 和 连接 技术 。 有 关 存 储 芯 片 的 扩展 和 连接 
技术 方面 的 知识 ,有 助 于 对 总 线 、 数 据 的 存放 顺序 和 对 齐 方式 等 许多 概念 的 理解 。 此 外 , 同 
步 存储 器 芯片 (如 SDRAM 芯片 ) 的 概念 与 后 面 CPU 设计 和 总 线 设 计 的 内 容 相 关 。 在 课时 
受 限 的 情况 下 ,对 于 记忆 单元 的 存储 和 读 写 原理 .存储 芯片 的 读 写 周 期 .DRAM 的 刷新 、 只 
读 存 储 器 等 内 容 只 要 概要 说 明 即 可 ,因为 这 些 不 属于 主干 内 容 , 也 比较 独立 ,对 其 他 内 容 的 
学 习 影 响 不 大 。 

对 于 cache, 首 先 ,应 着 重 讲 清楚 程序 访问 的 局 部 性 ,因为 程序 的 时 间 局 部 性 和 空间 局 部 
性 是 提出 并 实现 cache 的 基础 ,对 这 些 内 容 的 深刻 理解 ,也 有 助 于 编写 高 效 的 程序 。 通 过 具 
体 程序 示例 ,可 以 将 程序 访问 的 局 部 性 特点 讲 深 讲 透 。cache 和 主 存 之 间 的 映射 关系 可 能 
是 难点 部 分 ,主教 材 ? 中 例 4.4、 例 4.7 和 例 4. 8 是 针对 相同 主 存 大 小 和 相同 cache 行 数 的 3 
种 不 同 映射 关系 的 例子 ,课堂 教学 中 ,可 以 跳 过 主教 材 中 对 映射 关系 的 形式 化 描述 ,而 直接 
通过 这 3 个 例子 来 说 明 不 同 的 映射 关系 。 这 样 , 使 学 生 能 够 较 快 地 掌握 不 同 映射 关系 的 不 
同 实 现 方式 和 访 存 过 程 。 对 于 主教 材 中 的 例 4. 10, 可 通过 详细 讲解 几 个 关键 单元 (如 第 0、 
1、63、64 等 单元 ) 的 访问 ,使 学 生 能 够 深入 了 解 CPU 的 访 存 过 程 和 替换 算法 。 如 果 课 时 受 
限 ,cache 性 能 评估 、cache 结构 举例 ,以 及 影响 cache 性 能 的 因素 等 内 容 可 以 跳 过 或 仅 作 简 
单 讲解 。 

对 于 虚拟 存储 器 ,着 重 讲 清楚 请 求 分 页 的 思想 .虚拟 地 址 空间 的 概念 、 页 表 的 结构 地 址 
转换 过 程 和 快 表 的 概念 。 主 教材 中 图 4. 43 和 图 4. 44 反映 了 CPU 进行 一 次 存储 访问 的 过 
程 ,结合 对 这 两 张 图 的 讲解 和 对 表 4. 1 的 解读 ,可 以 加 深 学 生 对 CPU 访 存 过 程 的 理解 ,特别 
是 加 深 对 软件 和 硬件 分 工 协作 过 程 的 了 解 ,从 而 加 深 对 完整 的 存储 器 层次 化 结构 体系 的 理 
解 。 如 果 课 时 受 限 , 有 关 进 程 与 进程 的 上 下 文 .存储 器 管理 概述 、 存 储 保护 等 可 跳 过 或 仅 作 
简单 讲解 。 


4.2 主要 内 容 提要 


1， 存储 器 的 分 类 

存储 器 按 存 取 方式 分 为 随机 存 取 存储 器 、 顺 序 存 取 存储 器 、 直 接 存 取 存 储 器 和 相 联 存 取 
存储 器 ; 按 存储 介质 分 为 半导体 存储 器 、 磁 表面 存储 器 和 光盘 存储 器 ; 按 信息 的 可 更 改 性 分 
为 可 读 可 写 和 只 读 存储 器 ; 按 断 电 后 可 否 保 存 来 分 ,分 为 易 失 性 和 非 易 失 性 存储 器 ; 按 功能 、 
容量 、 速 度 3 个 方面 来 分 ,分 成 寄存 器 高速 缓存 (cache)、 主 存储 器 (内 存 )、 辅 助 存储 器 (外 
存 ) 和 海量 后 备 存储 器 。 

2， 存 储 器 的 分 层 结构 

因为 每 一 种 单独 的 存储 器 都 不 可 能 又 快 ,又 大 ,又 便宜 ,为 了 构建 这 种 理想 的 存储 器 系 
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统 , 计 算 机 中 采用 了 一 种 层次 化 的 存储 器 体系 结构 。 按 照 离 CPU 由 近 到 远 、 速 度 从 快 到 
慢 、 容 量 从 小 到 大 、 价 格 从 贵 到 便宜 的 顺序 ,将 不 同 的 存储 器 设置 在 计算 机 中 ,这 样 的 顺序 是 
寄存 器 -cache-> 主 存 一 磁盘 -> 光盘 和 磁带 。 

3. 半导体 随机 存 取 存储 器 的 组 织 
主 存 空间 的 RAM 区 由 若干 内 存 条 组 成 ,每 个 内 存 条 上 有 若干 存储 器 芯片 ,存储 器 芯片 
由 用 于 存储 信息 的 存储 阵列 外 加 地 址 缓存 器 、 地 址 译 码 器 、 读 写 控 制 电路 等 组 成 ,每 个 存储 
阵列 由 若干 行 和 若干 列 构成 ,每 个 行 、 列 交叉 处 是 一 个 记忆 单元 (存储 元 ), 每 个 记忆 单元 用 
来 存储 一 位 二 进位 0 或 1。 根 据 记 忆 单 元 结构 的 不 同 分 为 SRAM 芯片 和 DRAM 芯片 两 
种 ,SRAM 芯片 的 记忆 单元 采用 6 管 静态 MOS 管 存储 电路 ,其 功 耗 大 、 集 成 度 低 ,但 速度 
快 ,无 须 再 生 和 刷新 ,适合 构 作 高 速 小 容量 的 存储 器 ,如 cache;DRAM 芯片 的 记忆 单元 采用 
单 管 动态 MOS 管 存储 电路 ,因为 只 用 一 个 MOS 管 ,所 以 功 耗 小 、 集 成 度 高 ,但 由 于 靠 电 容 
储存 电荷 和 充 放电 来 存储 和 读 写 信息 ,所 以 速度 慢 ,并 需 定时 刷新 ,适合 构 作 慢 速 大 容量 的 
存储 器 ,如 主 存 。 

4， 只 读 存 储 器 

只 读 存 储 器 中 的 信息 用 特殊 方式 写 人 ,一 经 写 人 ,就 可 长 久保 存 , 是 非 易 失 性 存储 器 。 
其 存 取 方 式 也 为 随机 存 取 方 式 。 主 要 用 于 存放 固定 信息 ,如 微 程序 .BIOS、 引 导 程 序 或 嵌 人 
式 系统 中 固化 的 程序 和 数据 等 。 有 MROM、PROM、EPROM、EEPROM.、Flash ROM 等 
类 型 。 

5， 存储器 芯片 及 其 与 CPU 的 连接 

RAM 芯片 分 为 字 片 式 和 位 片 式 两 种 。 通 常 DRAM 芯片 都 是 位 片 式 ,多 位 DRAM 芯 
片 采用 多 个 位 平面 构成 ,每 个 位 平面 是 一 个 二 维 的 存储 阵列 。 行 地 址 和 列 地 址 共用 同一 组 
地 址 引 脚 , 称 为 行列 地 址 线 复 用 。 为 提高 存储 器 芯片 的 读 写 速度 ,DRAM 芯片 内 通常 会 有 
一 个 用 SRAM 实现 的 行 缓存 。 

存储 器 芯片 和 CPU 之 间 通 过 总 线 相连 ,总 线 中 包括 地 址 线 、 数 据 线 和 控制 线 。 地 址 线 
的 连接 需要 考虑 芯片 在 字 方向 上 的 扩展 ,采用 芯片 内 连续 编 址 方式 时 ,低位 用 于 芯片 内 地 
址 ,高 位 用 于 片 选 逻辑 , 片 选 信号 译 码 器 的 输出 连 到 芯片 的 片 选 信和 号 引 脚 上 ;数据 线 的 连接 
需要 考虑 芯片 在 位 方向 上 的 扩展 ,分 别 连 到 位 扩展 的 芯片 上 。 

6. 主 存 的 主要 技术 指标 

包括 存储 容量 、 存 取 时 间 、 存 储 周期 和 存储 器 带宽 。 存 储 容量 是 指 某 计 算 机 实际 配置 的 
容量 ,通常 , 它 小 于 最 大 可 配置 容量 ( 主 存 地 址 空间 大 小 ) ; 存 取 时 间 指 执行 一 次 读 操作 或 写 
操作 的 时 间 , 分 读 出 时 间 和 写 人 时 间 两 种 ;存储 周期 指 存 储 器 进行 连续 两 次 独立 的 读 或 写 操 
作 所 需要 的 最 小 时 间 间 隔 , 它 通常 大 于 存 取 时 间 ; 存 储 器 带宽 指 单位 时 间 内 从 存储 器 读 出 或 
写 人 存储 器 的 最 大 信息 量 。 

7. 多 模块 存储 器 

采用 多 模块 存储 器 的 目的 是 为 了 提高 访 存 速度 ,通过 多 个 存储 模块 并 行 工 作 可 以 达到 
目的 。 为 使 多 个 模块 并 行 工作 ,每 个 模块 除了 有 各 自 独立 的 存储 阵列 以 外 ,还 必须 有 独立 的 
地 址 缓存 器 、 数 据 缓存 器 、 地 址 译 码 器 和 读 写 控 制 电 路 等 。 

有 连续 编 址 和 交叉 编 址 两 种 组 织 方式 。 连 续 编 址 方式 下 , 按 高 位 地 址 划分 模块 ,地 址 在 
一 个 存储 模块 内 连续 编号 ,因此 同一 个 访 存 请 求 内 的 信息 在 同一 个 模块 中 ,无 法 并 行 。 只 有 
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同时 有 多 个 访 存 请 求 时 才能 并 行 ;交叉 编 址 方式 下 , 按 低 位 地 址 划分 模块 ,地 址 在 所 有 存储 
模块 之 间 交 叉 编号 , 因此 同一 个 访 存 请 求 内 的 信息 分 布 在 不 同 模 块 中 ,可 并 行 访问 所 有 模 
块 , 因 而 可 加 快 访问 速度 。 

8， 高 速 缓存 (cache) 

cache 是 在 CPU 和 主 存 之 间 设 置 的 高 速 小 容量 的 存储 器 。 引 入 cache 的 目的 是 为 了 提 
高 访 存 速度 。 与 多 模块 存储 器 通过 并 行 来 提高 速度 不 同 ,cache 之 所 以 能 提高 速度 ,是 因为 
程序 执行 时 代码 和 数据 的 存储 访问 具有 局 部 性 特点 。 程 序 访问 的 局 部 性 特点 体现 在 两 个 方 
面 : 时 间 局 部 性 和 空间 局 部 性 。 时 间 局 部 性 指 某 个 单元 在 一 个 很 短 的 时 间 段 内 被 重复 访问 
的 可 能 性 很 大 ;空间 局 部 性 指 某 个 单元 被 访问 后 其 周围 单元 不 久 也 将 被 访问 的 可 能 性 很 大 。 
这 样 , 只 要 将 刚 被 访问 的 单元 及 其 邻近 单元 一 起 复制 到 cache 中 ,那么 ,在 最 近 一 段 时 间 内 
CPU 访问 的 信息 都 可 以 在 cache 中 访问 到 ,而 不 需要 访问 慢 速 的 主 存 。 

实现 cache 时 需要 解决 一 系列 问题 ,例如 ,将 主 存 中 的 一 个 局 部 信息 块 装 和 人 cache 时 , 信 
息 块 大 小 多 大 ? 装 人 到 cache 的 何 处 ? CPU 如 何 根据 主 存 地 址 找到 cache 中 相应 的 信息 ? 
cache 装 满 的 情况 下 又 要 复制 新 的 主 存 块 到 cache 时 ,原来 在 cache 中 的 哪些 主 存 块 应 被 替 
换 出 来 ? 写 信 息 时 如 何 保证 主 存 中 和 cache 中 的 同一 个 信息 块 完全 一 致 ? 对 于 上 述 问 题 的 
简要 回答 如 下 。 

(1) cache 和 主 存 间 的 映射 关系 

将 主 存 地 址 空间 划分 成 大 小 相等 的 信息 块 ,从 0 开始 给 每 个 块 编号 。cache 由 若干 行 组 
成 ,每 一 行 中 有 一 个 用 于 存放 主 存 块 的 槽 ,其 大 小 与 主 存 块 大 小 一 样 ,cache 行 也 从 0 开始 编 
号 。 在 将 主 存 块 复制 到 cache 行 时 , 主 存 块 号 和 cache 行 号 之 间 可 采用 直接 映射 ,全 相 联 映 
射 和 组 相 联 映射 3 种 映射 关系 。 

直接 映射 时 ,每 个 主 存 块 对 应 一 个 固定 的 cache 行 ,其 映射 关系 为 : 

cache 行 号 三 主 存 块 号 mod cache 行 数 

此 时 , 主 存 地 址 划分 为 标记 、cache 行 号 ( 行 索 引 ) 和 块 内 地 址 3 个 字段 。 

全 相 联 映射 时 ,每 个 主 存 块 可 复制 到 任何 一 个 cache 行 中 , 主 存 地 址 划分 为 标记 和 块 内 
地 址 两 个 字段 。 

组 相 联 映射 时 ,cache 分 若干 组 ,每 组 有 多 行 , 各 主 存 块 存放 到 固定 组 的 任意 行 中 ,其 映 
射 关 系 为 : 

cache 组 号 三 主 存 块 号 mod cache 组 数 

此 时 主 存 地 址 划分 为 标记 、cache 组 号 (组 索引 ) 和 块 内 地 址 3 个 字段 。 

(2) CPU 访 存 过 程 

CPU 给 出 主 存 地 址 后 ,首先 根据 映射 方式 对 主 存 地 址 进行 划分 ,根据 中 间 的 行 索引 或 
组 索引 的 值 ,确定 将 主 存 地 址 高 位 部 分 的 标记 字段 与 哪些 cache 行 中 的 标记 进行 比较 。 显 
然 , 对 于 直接 映射 ,只 需 比较 一 个 cache 行 ; 对 于 全 相 联 映射 , 则 需 与 所 有 行进 行 比较 ;对 于 
组 相 联 映射 , 则 与 组 内 所 有 行 比较 。 若 存在 某 个 cache 行 中 的 标记 与 主 存 地 址 中 的 标记 字 
段 相等 ,并 且 该 行 中 的 有 效 位 为 1, 则 访问 命中 ,此 时 ,根据 主 存 地 址 中 低位 部 分 的 块 内 地 址 
访问 该 行 中 相应 的 信息 ; 若 所 有 行 中 的 标记 都 不 等 于 主 存 地 址 中 的 标记 字段 ,或 有 相等 的 行 
但 对 应 的 有 效 位 为 0, 则 访问 不 命中 (缺失 ) ,此 时 ,需要 将 该 主 存 地 址 所 在 的 块 从 主 存 取 到 
cache, 并 根据 主 存 块 的 位 置 在 cache 行 中 置 标记 , 且 置 有 效 位 为 1。 
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(3) 替换 算法 

当 需 要 调 人 一 个 新 的 主 存 块 而 对 应 的 cache 行 全 满 时 ,需要 将 这 些 cache 行 中 某 个 主 存 
块 替 换 出 来 。 常 用 的 替换 算法 有 先进 先 出 (FIFO)、 最 近 最 少 用 (LRU) 等 。FIFO 算法 的 基 
本 思想 是 ,总 是 把 最 先 调 到 cache 的 那个 主 存 块 淘汰 掉 ;LRU 算法 的 基本 思想 是 ,总 是 把 最 
近 最 少 用 到 的 那个 主 存 块 淘汰 掉 。 

(4) 写 策略 (一 致 性 问题 ) 

CPU 执行 写 操作 时 ,为 了 保证 主 存 和 cache 中 同一 个 主 存 块 的 一 致 性 ,可 采用 回 写 法 
(Write Back) 和 全 写法 (Write Through) 两 种 写 策略 。 回 写法 的 基本 思想 是 ,暂时 只 写 
cache, 替 换 时 一 次 性 将 cache 中 的 主 存 块 写 回 主 存 ; 全 写法 的 基本 思想 是 ,每 次 写 cache 的 
同时 也 写 主 存 ,为 了 加 快 写 的 过 程 ,可 在 cache 和 主 存 间 加 一 个 写 缓存 (Write Buffer)。 

当 写 不 命中 时 ,有 写 分 配 法 (Write Allocate) 和 非 写 分 配 法 (Not Write Allocate) 两 种 方 
式 。 采 用 写 分 配 法 时 ,需要 分 配 一 个 cache 空 行 , 以 将 主 存 块 复制 到 cache; 采 用 非 写 分 配 法 
时 ,不 将 主 存 块 复制 到 cache。 因 此 , 回 写 策略 下 ,一 定 采 用 写 分 配 法 ,而 全 写 策 略 下 ,两 种 分 
配方 式 都 可 以 采用 。 

《5) 主 存 块 大 小 的 选择 

主 存 块 大 小 是 主 存 和 cache 之 间 进 行 信息 交换 的 基本 单位 , 主 存 块 大 小 与 命中 率 和 缺 
失 损 失 关 系 极 大 ,因而 块 大 小 的 选择 非常 重要 。 主 存 块 太 小 , 则 不 能 很 好 地 利用 空间 局 部 
性 ,进而 影响 命中 率 ; 主 存 块 太 大 , 则 增加 主 存 块 的 读 取 时 间 , 即 缺失 损失 变 大 ,而 且 , 由 于 块 
变 大 ,使 得 cache 行 数 减少 ,映射 到 同一 个 cache 行 的 主 存 块 数 增加 ,进而 会 使 缺失 率 上 升 。 

9. 虚拟 存储 器 

虚拟 存储 管理 是 现代 计算 机 系统 中 普遍 采用 的 存储 管理 方式 。 在 采用 虚拟 存储 管理 的 
计算 机 系统 中 ,每 个 进程 具有 一 个 一 致 的 、 极 大 的 、 私 有 的 虚拟 地 址 空间 ,虚拟 地 址 空间 按 等 
长 的 页 来 划分 , 主 存 也 按 等 长 的 页 框 划 分 。 进 程 执行 时 将 当前 用 到 的 页 面 装 入 主 存 ,其 他 暂 
时 不 用 的 部 分 放 在 磁盘 上 ,通过 页 表 建 立 虚拟 页 和 主 存 页 框 之 间 的 对 应 关系 。 对 于 不 在 主 
存 的 页 面 ,在 页 表 中 记录 其 在 磁盘 上 的 地 址 。 在 指令 执行 过 程 中 ,由 特殊 的 硬件 MMU 和 
操作 系统 一 起 实现 存储 访问 。 

虚拟 存储 器 的 实现 方式 有 分 页 式 、 分 段 式 和 有 段 页 式 3 种 。CPU 执行 指令 时 ,通过 指令 
寻 址 方式 计算 得 到 的 有 效 地 址 通常 是 一 个 虚拟 地 址 ( 即 逻 辑 地 址 )。CPU 中 的 地 址 转换 部 
件 根据 虚拟 地 址 中 的 虚 页 号 ,找到 对 应 的 页 表 项 ,然后 通过 页 表 项 得 到 该 虚 页 号 对 应 的 页 框 
号 ( 即 物理 页 号 、 实 页 号 ) ,最 后 将 它 和 页 内 地 址 拼接 得 到 物理 地 址 ( 即 主 存 地 址 、 实 地 址 ) 。 

每 个 进程 有 一 个 页 表 , 每 个 页 表 项 由 有 效 ( 装 人 ) 位 、 使 用 位 、 修 改 位 存 取 权限 位 、 主 存 
页 框 号 或 磁盘 地 址 等 组 成 。 在 地 址 转换 过 程 中 , 若 对 应 页 表 项 中 的 有 效 位 为 0, 则 说 明 该 页 
面 不 在 主 存 中 , 即 “ 缺 页 ”, 此 时 ,CPU 调 出 操作 系统 的 缺 页 处 理 程序 执行 ,该 程序 从 磁盘 读 
人 所 需 页 面 到 主 存 ,并 修改 页 表 。 缺 页 处 理 后 ,必须 回 到 原来 发 生 缺 页 的 指令 重新 执行 。 

为 了 减少 从 主 存 访问 页 表 的 次 数 ,通常 将 常用 页 表 项 放 在 CPU 的 一 个 高 速 缓存 中 ,这 
个 高 速 缓存 被 称 为 TLB( 快 表 ) 。 

可 以 利用 虚拟 存储 管理 机 制 进 行 存储 保护 ,主要 有 地 址 越界 和 访问 越权 两 种 内 存 保护 
错误 ,通常 称 它们 为 访问 违例 或 存储 器 访问 异常 。 

图 4.1 给 出 了 CPU 通过 TLB 和 页 表 进 行 地 址 转换 ,并 根据 转换 得 到 的 主 存 地 址 进行 
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| cache 访问 的 全 过 程 。 图 中 TLB 和 cache 都 采用 组 相 联 映射 方式 。 
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图 4.1 地 址 转换 和 cache 访问 过 程 
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4.3 ”基本 术语 解释 


随机 访问 存储 器 (Random Access Memory, RAM) 

其 特点 是 按 地 址 访问 信息 。 对 于 一 个 RAM 芯片 来 说 ,所 有 单元 的 地 址 位 数 一 样 ,所 以 
每 个 单元 的 地 址 译 码 所 用 时 间 一 样 。 从 这 个 角度 来 说 ,这 种 存储 器 中 每 个 单元 的 存 取 时 间 
与 存储 单元 的 物理 位 置 无 关 。 

相 联 存储 器 (Content Addressed Memory,Associate Memory,CAM) 

其 特点 是 按 内 容 访 问 信 息 。 即 已 知 要 访问 信息 的 部 分 内 容 ,通过 与 每 个 存储 单元 的 相 
应 内 容 进行 比较 找到 需 访 问 信息 的 位 置 , 然 后 读 写 信 息 。 

静态 随机 访问 存储 器 (Static RAM,SRAM) 

车 触发 器 的 双 稳 态 正 负 反 馈 电路 存储 信息 ,因而 速度 快 , 是 非 破 坏 性 读 出 ,但 电路 中 元 
器 件 多 ,因而 集成 度 小 ,适合 做 高 速 小 容量 的 高 速 缓冲 存储 器 (cache) 。 

动态 随机 访问 存储 器 (Dynamic RAM,DRAM) 

人 靠 电容 存储 电荷 来 保存 信息 。 若 电容 上 存 有 足够 多 的 电荷 表示 存 “1”, 电 容 上 无 电荷 表 
示 存 “0”。 是 破坏 性 读 出 , 读 后 需要 再 生 , 而 且 需 要 定时 刷新 。 

刷新 (Refresh) 

DRAM 芯片 中 ,MOS 管 栅 极 电容 上 的 电荷 会 被 逐渐 放电 ,只 能 维持 几 到 几 十 毫秒 , 因 
此 ,即使 电源 不 掉 电 ,也 会 自动 消失 ,需要 定时 对 所 有 存储 单元 进行 充 / 放 电 , 以 恢复 原来 的 
电荷 。 这 个 过 程 称 为 刷新 。 

易 失 性 存储 器 (Volatile Memory) 

电源 掉 电 后 ,存储 器 中 的 信息 全 部 消失 ,如 高 速 缓存 (cache)、 主 存 中 的 RAM 等 都 属于 
易 失 性 存储 器 。 

非 易 失 性 存储 器 (Nonvolatile Memory) 

存储 器 中 的 信息 不 会 因为 电源 掉 电 而 消失 ,如 只 读 存 储 器 (了 ROM)、 磁 盘 、 光盘、 闪存 
(Flash 存储 器 ) 等 都 属于 非 易 失 性 存储 器 。 

记忆 单元 (存储 基 元 、 存 储 元 ) (Memory Cell) 

具有 两 种 稳 态 的 能 够 表示 二 进 制 数码 0 和 1 的 物理 器 件 ,一 个 记忆 单元 表示 1 位 信息 。 

存储 单元 (Memory Unit) 

主 存 中 具有 相同 地 址 的 那些 位 构成 一 个 存储 单元 。 因 此 ,存储 单元 的 宽度 等 于 一 个 编 
址 单位 的 长 度 , 可 以 是 8 位 .16 位 、32 位 等 。 现 在 ,大 多 数 计算 机 是 按 字 节 编 址 的 , 即 每 一 个 
字 节 (8 位 ) 有 一 个 地 址 , 编 址 单位 就 是 一 个 字 节 ,所 以 一 个 存储 单元 的 宽度 (位 数 ) 是 8 位 。 

存储 器 地 址 寄存 器 (Memory Address Register, MAR) 

CPU 中 用 来 存放 存储 器 地 址 的 寄存 器 ,地 址 在 送 到 总 线 的 地 址 线 之 前 , 先 寄 存在 MAR 
中 。 所 以 , 它 的 宽度 应 该 等 于 地 址 线 的 宽度 ,也 等 于 主 存 地 址 位 数 ,其 值 决定 了 主 存 最 大 的 
寻 址 空间 。 

存储 器 数据 寄存 器 (Memory Data Register, MDR) 

有 时 也 称 为 存储 器 缓冲 寄存 器 (MBR) 。CPU 中 用 来 存放 写 人 主 存 或 从 主 存 读 出 的 数 
据 的 寄存 器 ,数据 在 送 到 总 线 的 数据 线 之 前 ,或 从 主 存 读 到 CPU 时 ,都 先 寄存 在 MDR 中 。 
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所 以 , 它 的 宽度 应 该 等 于 总 线 数据 线 的 宽度 。 

存 取 时 间 (Access Time) 

执行 一 次 读 操作 或 写 操 作 的 时 间 。 分 读 出 时 间 和 写 人 时 间 。 读 出 时 间 为 从 主 存 接收 有 
效 地 址 开始 到 数据 取出 有 效 为 止 的 时 间 ; 写 人 时 间 是 从 主 存 接收 有 效 地 址 开始 到 数据 写 人 
被 写 单元 为 止 的 时 间 。 

存储 周期 (Memory Cycle Time) 

存储 周期 Tm 是 指 存储 器 进行 连续 两 次 独立 的 读 或 写 操作 所 需要 的 最 小 时 间 间 隔 。 

存储 器 带宽 (Bandwidth) 

每 秒 钟 从 存储 器 进 / 出 信息 的 最 大 数量 。 假 设 存储 周期 为 50ns, 每 个 存储 周期 最 多 可 
存 取 64 位 数据 , 则 带宽 为 1.28Gb/s。 

片 选 信号 (Chip Select Signal) 

一 个 存储 芯片 的 容量 往往 满足 不 了 计算 机 对 存储 容量 的 要 求 , 所 以 需要 将 一 定数 量 的 
芯片 按 一 定 方式 连接 成 一 个 完整 的 存储 器 。 在 访问 某 个 字 时 ,必须 “选中 ”该 字 所 在 的 芯片 ， 
而 其 他 芯片 不 被 “选中 ”, 控 制 芯片 是 否 被 选中 的 信号 即 片 选 信号 CS。 

地 址 引 脚 复 用 (Address Pin Multiplexing) 

DRAM 芯片 采用 二 维 译 码 方式 ,为 了 减少 引 脚 个 数 ,把 行 地 址 和 列 地 址 用 同一 组 地 址 
引 脚 线 分 时 进行 传送 。 靠 行 地 址 选 通信 号 和 列 地 址 选 通信 号 来 区 分 在 地 址 引 脚 线 上 传送 的 
是 行 地 址 还 是 列 地 址 。 

行 地 址 选 通信 号 (Row Address Strobe,RAS) 

DRAM 芯片 中 , 行 地 址 选 通信 号 有 效 时 ,说 明 在 地 址 引 脚 线 上 传输 的 是 行 地 址 信号。 

列 地 址 选 通信 号 (Column Address Strobe,CAS) 

DRAM 芯片 中 , 列 地址 选 通信 号 有 效 时 ,说 明 在 地 址 引 脚 线 上 传输 的 是 列 地 址 信号。 

只 读 存 储 器 (Read Only Memory, ROM) 

这 种 存储 器 的 原始 信息 一 旦 被 写 人 ,在 程序 执行 过 程 中 ,只 能 对 其 内 容 进行 读 出 ,而 不 
能 写 入 。 只 读 存储 器 通常 用 来 存放 固定 不 变 的 信息 。 

掩 膜 ROM(Mask ROM) 

由 厂家 在 生产 过 程 中 一 次 形成 的 。 即 信息 已 经 完全 固化 在 芯片 中 ,无 法 修改 。 结 构 类 
似 于 字 片 式 RAM, 没 有 写 人 机 构 。 这 类 ROM 适合 大 批量 生产 。 

PROM(Programmable ROM) 

可 编程 只 读 存 储 器 ,在 使 用 时 由 使 用 者 专门 一 次 写 人 ,以 后 再 也 不 能 改变 。 

EPROM(Erasable PROM) 

可 擦 除 可 编程 只 读 存储 器 ,可 以 用 特殊 的 装置 反复 擦 除 和 重 写 。 一 般 将 芯片 放 在 紫外 
线 下 照射 15~20 分 钟 , 信 息 全 部 擦 除 。 

EEPROM(Electrically Erasable PROM) 

电 可 擦 除 可 编程 只 读 存 储 器 ,使 用 电 可 擦 除 技术 (加 高 电压 擦 除 ) ,可 擦 除 个 别 单元 。 写 
操作 比 读 操作 花 更 多 的 时 间 。 集 成 度 比 EPROM 低 , 而 且 更 贵 。 

闪存 (Flash Memory) 

是 一 种 新 型 的 非 易 失 性 存储 器 。 不 像 RAM 那样 需要 电源 支持 才能 保存 信息 ,但 又 像 
RAM 一 样 具 有 可 写 性 。 在 某 种 低 电 压 下 ,其 内 容 可 读 不 可 写 , 此 时 类 似 于 ROM ;在 一 种 高 
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电压 下 ,信息 可 更 改 或 删除 ,这 时 又 类 似 于 RAM。 常 用 于 存储 主板 BIOS 程序 ,或 用 作 数 码 
照相 机 存储 卡 和 优盘 ,也 可 做 成 固态 硬盘 以 代替 磁盘 存储 器 作为 辅助 存储 器 使 用 。 

双 口 RAM(Dual-port RAM) 

并 行 存储 结构 中 的 一 种 。 双 口 RAM 利用 的 是 空间 并 行 技 术 , 它 为 一 个 存储 体 提供 两 
组 独立 的 读 写 控制 电路 和 两 个 读 写 端口 ,因而 可 以 对 两 个 数据 进行 并 行 的 读 写 。 

多 模块 存储 器 (Multi-module Memory) 

多 模块 存储 器 中 包含 多 个 小 体 ,但 每 个 体 有 其 自己 的 MAR、MDR 和 读 写 电路 ,可 独立 
组 成 一 个 存储 模块 。 根 据 不 同 的 编 址 方式 可 分 为 连续 编 址 和 交叉 编 址 。 

低位 交叉 编 址 (Low-order Interleaving) 

也 称 交 叉 编 址 ,低位 表示 存储 器 模块 号 ,高 位 表示 存储 器 模块 内 地 址 ,使 地 址 交叉 分 散 
在 各 模块 内 。 

高 位 交叉 编 址 (High-order Interleaving) 

也 称 连 续 编 址 , 主 存 地 址 高 位 表示 存储 器 模块 号 ,低位 表示 存储 器 模块 内 地 址 ,使 地 址 
在 同 模块 内 连续 编 址 。 

高 速 缓 存 (cache) 

在 CPU 和 主 存 之 间 的 一 个 高 速 小 容量 的 存储 器 ,在 访问 主 存 前 先 到 该 存储 器 访问 。 
如 果 将 当前 正在 访问 的 那个 存储 单元 所 在 的 主 存 块 放 到 该 存储 器 中 ,根据 程序 访问 的 局 部 
化 特性 ,这 个 主 存 块 中 的 信息 应 该 是 最 近 经 常 要 访问 的 ,因此 不 必 再 到 主 存 去 访问 ,这 样 就 
可 很 快 得 到 所 需要 的 信息 。 

程序 访问 的 局 部 性 

对 大 量程 序 调查 发 现 ,程序 在 执行 过 程 中 产生 的 访 存 要 求 ,其 地 址 具有 局 部 化 特性 。 也 
就 是 说 ,在 一 个 很 小 的 时 间 段 内 ,访问 的 存储 器 地 址 大 多 在 一 个 局 部 区 域内 。 体 现在 时 间 和 
空间 两 个 方面 ,可 分 为 时 间 局 部 性 和 空间 局 部 性 两 种 。 

时 间 局 部 性 (Temporal Locality) 

时 间 局 部 性 是 指 刚刚 被 访问 的 单元 很 可 能 在 一 个 很 短 的 时 间 内 被 再 次 访问 。 

空间 局 部 性 (Spatial Locality) 

空间 局 部 性 是 指 刚刚 被 访问 的 单元 的 临近 单元 很 可 能 不 久 也 会 被 访问 。 

命中 率 (Hit Rate) 

在 快速 的 缓存 中 得 到 信息 的 概率 。 例 如 ,在 总 共 100 次 访问 中 ,能 在 cache 中 访问 到 信 
息 的 次 数 为 99 次 , 则 命中 率 为 99%。 

命中 时 间 (Hit Time) 

在 命中 情况 下 的 访问 时 间 。 包 括 判断 是 否 命中 的 时 间 和 在 上 层 快 速 存 储 器 中 的 访问 时 
间 两 部 分 。 

缺失 率 (Miss Rate) 

有 些 中 文书 翻译 成 “ 失 靶 率 ? 或 “失效 率 ”。 就 是 指 没 有 命中 的 概率 。 如 在 总 共 100 次 访 
问 中 ,能 在 cache 中 访问 到 信息 的 次 数 为 99 次 , 则 缺失 率 为 1% 。 

缺失 损失 (Miss Penalty) 

指 在 缺失 情况 下 ,从 主 存 取 一 个 主 存 块 到 cache 的 时 间 ,也 称 为 不 命中 开销 。 

主 存 块 (Block) 
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主 存 和 cache 之 间 进 行 信息 交换 的 单位 。 把 主 存 分 成 大 小 相等 的 块 , 主 存 块 从 0 开始 
编号 。 访 问 某 个 主 存单 元 时 ,就 把 这 个 单元 所 在 的 一 个 主 存 块 调 到 cache, 根 据 程序 访问 的 
局 部 性 特点 ,在 随后 的 一 段 时 间 内 ,CPU 很 可 能 要 经 常 访问 这 个 主 存 块 。 因 为 该 主 存 块 已 
调 到 cache, 所 以 很 多 时 候 就 不 需要 访问 主 存 了 。 

cache 棋 或 cache 行 (Slot/Line) 

cache 由 若干 行 组 成 ,每 一 行 中 有 一 个 用 于 存放 主 存 块 的 模 , 其 大 小 与 主 存 块 一 样 ， 
cache 行 也 从 0 开始 编号 ,cache 行 号 就 是 槽 号 。 

直接 映射 cache(Direct-mapped cache) 

把 主 存 的 每 一 块 映射 到 cache 的 一 个 固定 行 中 。 这 样 ,“ 主 存 块 号 ”和 “cache 行 号 ?存在 
模 映射 关系 ,因此 也 称 为 模 映 射 (Module Mapping) , 即 

cache 行 ( 槽 ) 号 = 主 存 块 号 mod cache 行 数 

全 相 联 映射 cache(Fully Associative cache) 

每 个 主 存 块 可 装 人 到 cache 任意 一 行 中 。 每 个 cache 行 的 标志 字段 指出 了 该 行 的 数据 
信息 取 自 主 存 的 哪个 块 。 

组 相 联 映射 cache(Set-associative cache) 

结合 直接 映射 和 全 相 联 映射 的 特点 ,将 cache 所 有 行 分 组 ,把 一 个 主 存 块 映射 到 特定 
cache 组 的 任 一 行 中 , 即 组 间 模 映射 ,组 内 全 映射 。 其 映射 关系 为 cache 组 号 = 主 存 块 号 
mod cache 组 数 。 

多 级 cache(Multilevel cache) 

在 计算 机 系统 中 ,同时 使 用 多 个 层次 的 cache。 例 如 ,在 CPU 和 主 存 之 间 设 置 两 级 
cache: Ll cache 和 L2 cache。 一般 L1 cache 是 数据 cache 和 代码 cache 分 离 的 。 

数据 cache(Data cache) 

专门 用 来 存放 数据 信息 的 高 速 缓冲 存储 器 。 

代码 cache(Code cache) 

专门 用 来 存放 指令 代码 的 高 速 缓冲 存储 器 ,也 称 为 指令 cache。 

分 离 式 cache(Split cache) 

指数 据 和 指令 分 开 存 放 在 各 自 的 数据 cache 和 指令 cache 中 。 

先进 先 出 (First-In-First-Out,FIFO) 

是 一 种 蔡 换 算法 ,其 基本 思想 是 ,总 是 把 最 先 调和 cache 的 一 个 主 存 块 替换 出 去 。 

最 近 最 少 用 (Least Recently Used, LRU) 

是 一 种 蔡 换 算法 ,其 基本 思想 是 ,总 是 把 最 近 最 少 用 的 一 个 主 存 块 从 cache 中 替换 
出 去 。 

全 写 (Write Through) 

每 次 写 cache 的 同时 也 写 主 存 , 主 存 与 cache 始终 保持 一 致 。 这 种 方式 比较 简单 ,能 保 
持 主 存 与 cache 副本 的 一 致 性 ,但 要 插入 慢 速 的 访 存 操作 ,而 且 有 些 写 和 人 过程 有 可 能 是 不 必 
要 的 ,例如 中 间 结 果 的 写 信 操作。 这 种 方式 的 中 文 说 法 较 多 ,有 全 写 、 直 写 、 写 直达 、 通 过 式 
写 等 。 

写 缓冲 (Write Buffer) 

在 使 用 全 写 方式 处 理 写 操作 时 ,为 了 减少 每 次 写 主 存 的 时 间 ,在 cache 和 主 存 之 间 加 一 
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个 写 缓 冲 。 这 样 ,不 必 每 次 都 写 主 存 , 面 只 要 写 到 一 个 快速 的 写 缓 冲 就 行 了 。 当 进行 写 操作 
时 ,CPU 先 同时 写 cache 和 写 缓冲 ,然后 由 存储 控制 器 将 写 缓冲 内 容 写 到 主 存 。 

回 写 (Write Back) 

每 次 写 操作 时 ,CPU 先 暂 时 只 写 cache, 并 用 修改 位 (dirty bit) 指 明 对 应 行 中 的 信息 是 
否 被 更 新 过 。 当 某 块 内 容 需 从 cache 中 替换 出 去 时 ,车 信息 被 修改 过 , 则 将 其 一 次 写 人 主 
存 , 否 则 不 需 写 主 存 。 这 种 方式 不 在 写 cache 中 插入 慢 速 的 写 主 存 操作 ,可 以 保持 程序 运行 
的 快速 性 。 但 在 写 回 主 存 前 , 主 存 与 cache 的 内 容 可 能 不 一 致 ,因而 会 引起 主 存 内容 失 效 。 
这 种 方式 的 中 文 说 法 较 多 ,有 写 回 、 回 写 、 一 次 性 写 等 。 

3-C 模型 (Three C’s Model) 

存储 器 层次 结构 中 信息 访问 时 的 缺失 类 型 以 及 结构 的 改变 对 这 些 缺 失 类 型 的 影响 ,可 
以 用 一 个 模型 来 进行 分 析 。 该 模型 给 出 的 3 个 缺失 类 型 (强制 缺失 Compulsory Miss、 容 量 
缺失 Capacity Miss、 冲 突 缺 失 Conflict Miss) 名 称 的 首 字 母 正 好 都 是 “C” 所 以 称 为 3-C 
模型 。 

强制 缺失 (Compulsory Miss) 

调和 人 cache 前 第 一 次 被 用 到 时 ,会 发 生 缺 失 。 此 时 的 缺失 也 被 称 为 冷 启动 缺失 (Cold- 
start Miss) 。 

容量 缺失 (Capacity Miss) 

由 于 cache 容量 的 限制 ,使 有 些 主 存 块 无 法 继续 保存 在 cache 中 而 造成 缺失 。 其 直接 原 
因 就 是 刚 被 蔡 换 出 去 的 块 很 快 又 需要 取 回 来 。 

冲突 缺失 (Conflict Miss) 

这 种 缺失 现象 发 生 在 组 相 联 或 直接 映射 cache 中 多 个 块 同时 竞争 同一 个 位 置 时 。 

虚拟 存储 器 (Virtual Memory) 

虚拟 存储 器 是 一 种 存储 管理 机 制 ,在 采用 虚拟 存储 器 的 系统 中 ,每 个 作业 运行 时 ,可 以 
只 装 入 当前 执行 到 的 一 部 分 到 内 存 ,而 让 暂时 执行 不 到 的 另 一 部 分 放 在 磁盘 上 , 当 需 要 用 到 
时 再 从 磁盘 装 人 到 主 存 , 这 样 使 得 在 很 小 的 主 存 空 间 能 运行 一 个 比 它 大 的 作业 ,而 且 用 户 编 
写 程序 时 用 到 的 逻辑 地 址 空间 可 以 比 主 存 地 址 空间 大 。 对 用 户 来 说 ,好 像 计算 机 系统 具有 
一 个 容量 很 大 的 存储 器 , 称 为 “虚拟 存储 器 ”。 

物理 存储 器 (Physical Memory) 

通常 把 主 存储 器 称 为 物理 存储 器 。 

虚拟 地 址 (Virtual Address) 

在 虚拟 存储 管理 机 制 中 ,每 个 源 程 序 经 编译 .汇编 .链接 等 处 理 生成 可 执行 的 二 进 制 机 
器 目标 代码 时 ,每 个 程序 的 目标 代码 都 被 映射 到 同样 的 虚拟 地 址 空间 。 因 此 ,通常 把 用 户 程 
序 的 指令 及 其 操作 数 所 在 地 址 称 为 虚拟 地 址 ,或 称 为 逻辑 地 址 。 虚 拟 地 址 的 位 数 确 定 了 虚 
拟 地 址 空间 的 大 小 。 例 如 ,如 果 虚 拟 地 址 为 32 位 , 则 虚拟 地 址 空间 大 小 为 2%。 

虚 页 号 (Virtual Page Number, VPN) 

为 了 实现 分 页 虚拟 存储 管理 机 制 ,通常 把 虚拟 地 址 空间 划分 为 若干 等 长 的 块 , 每 块 称 为 
一 页 (Page)。 每 页 按 顺 序 进行 编号 ,从 第 0 页 开始 ,虚拟 地 址 空间 所 包含 的 页 数 决定 了 虚 页 
号 的 位 数 ,虚拟 地 址 的 高 位 部 分 为 虚 页 号 。 

页 内 偏 移 量 (Page Offset) 
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| 页 内 偏 移 量 指出 需 访问 的 逻辑 地 址 位 于 当前 页 的 哪个 位 置 。 页 面 大 小 决定 了 页 内 偏 移 
| 量 的 位 数 ,例如 ,如 果 一 个 虚拟 页 的 大 小 为 2K 字 节 ,那么 ,页 内 偏 移 量 就 是 11 位 。 它 为 虚 
拟 地 址 的 低位 部 分 。 

物理 地 址 (Physical Address) 

通常 将 主 存储 器 地 址 称 为 物理 地 址 ,也 称 主 存 地 址 或 实地 址 。 

页 框 (Page Frame) 

有 些 书 把 页 框 ( 有 时 也 翻译 为 页 帧 ) 称 为 物理 页 或 实 页 。 操 作 系统 在 管理 内 存 时 , 按 页 
为 单位 进行 内 存 分 配 。 其 具体 做 法 是 ,把 主 存储 器 分 成 固定 长 且 比 较 小 的 存储 块 , 称 为 页 
框 , 每 个 进程 也 被 划分 成 等 长 的 程序 块 。 这 样 , 对 进程 进行 存储 分 配 时 ,将 一 个 程序 块 ( 即 虚 
拟 页 ) 装 到 一 个 可 用 的 存储 块 (页 框 ) 中 。 

物理 页 号 (Physical Page Number, PPN) 

把 主 存 空间 分 成 固定 长 的 页 框 , 从 0 开始 按 顺 序 编号 ,该 编号 就 是 物理 页 号 ,也 称 为 页 
框 号 或 实 页 号 。 物 理 地 址 的 高 位 部 分 是 物理 页 号 。 

地 址 变换 (Address Translation/Memory Mapping) 

把 指令 中 的 虚拟 地 址 转换 为 物理 地 址 的 过 程 称 为 地 址 变换 。 

重 定位 (Relocation) 

在 采用 虚拟 存储 管理 机 制 的 系统 中 ,每 个 进程 都 有 一 个 同样 的 虚拟 地 址 空间 。 在 程序 
装 人 系统 运行 时 ,操作 系统 把 用 户 程 序 的 一 部 分 或 全 部 放 到 内 存 中 ,并 把 存放 的 物理 地 址 信 
息 记 录 到 段 表 或 页 表 中 ,以 建立 虚拟 地 址 空间 和 物理 地 址 空间 之 间 的 映射 。 实 现 这 种 映射 
的 过 程 称 为 程序 重 定位 , 它 建 立 了 逻辑 地 址 和 物理 地 址 的 映射 关系 ,实现 了 逻辑 地 址 向 物理 
地 址 的 转换 。 所 以 , 某 种 程度 上 重 定位 和 地 址 转换 是 同一 个 概念 。 

有 两 种 重 定位 方式 : 一 种 方式 通过 链接 程序 或 加 载 程序 进行 地 址 转换 而 实现 程序 重 定 
位 ,这 种 方式 下 ,程序 执行 时 每 条 指令 中 的 地 址 已 经 是 物理 地 址 , 称 为 静态 重 定位 ; 另 一 种 方 
式 是 在 程序 执行 过 程 中 由 硬件 动态 实现 地 址 转换 , 称 为 动态 重 定位 。 

页 表 (Page Table) 

每 个 进程 有 一 个 页 表 , 记 录 该 进程 的 每 个 虚拟 页 存放 在 主 存 的 哪个 页 框 中 ,或 在 辅 存 哪 
个 地 方 。 页 表 中 一 般 有 装 人 位 、 修 改 位 、 替 换 控制 位 访问 控制 位 、 物 理 页 号 等 。 

页 表 基 址 寄存 器 (Page Table Base Register) 

每 个 进程 有 一 个 页 表 , 页 表 在 主 存 中 的 首 地 址 被 记录 在 一 个 特殊 的 寄存 器 中 ,这 个 特殊 
寄存 器 被 称 为 页 表 基 址 寄存 器 ,简称 页 表 寄 存 器 。 

有 效 位 (Valid Bit) 

用 来 表示 对 应 的 虚 页 是 否 装 人 主 存 并 有 效 , 也 称 为 装 人 位 。 若 该 位 为 "1” ,表示 该 页 在 
主 存 中 并 且 没 有 被 淘汰 。 若 该 位 为 “0”, 则 说 明 该 页 不 在 主 存 , 发 生 了 ”“ 缺 页 ?异常 。 

修改 位 (Modify Bit) 

用 来 表示 对 应 的 虚 页 在 主 存 期 间 是 否 被 修改 过 。 若 该 位 为 “1”, 则 表明 该 页 已 被 修改 
过 ,淘汰 时 必须 将 该 页 写 回 到 磁盘 。 若 该 位 为 “0”, 则 表明 该 页 未 被 修改 过 ,淘汰 时 不 需要 将 
该 页 写 回 到 磁盘 。 有 些 作者 或 系统 把 它 称 为 “ 脏 位 (Dirty Bit)”。 

使 用 位 (Reference Bit/ Use Bit) 

用 来 表示 对 应 虚 页 的 使 用 情况 , 据 此 操作 系统 可 以 了 解 该 页 是 最 近 经 常 被 访问 还 是 很 
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少 被 访问 ,因而 确定 该 页 是 否 马上 被 蔡 换 。 所 以 ,也 称 为 替换 控制 位 。 

访问 方式 位 (Access Bit) 

用 来 表示 虚 页 的 读 写 权限 。 例 如 ,代码 段 所 在 虚 页 的 访问 方式 一 般 是 “执行 /只 读 ”; 共 
享 数 据 段 所 在 虚 页 一 般 是 “只 读 ”; 私 有 数据 段 所 在 虚 页 一 般 是 “可 读 可 写 ”。 该 位 也 被 称 为 
访问 控制 位 或 存 取 权限 位 。 

缺 页 (Page Fault) 

需要 访问 的 虚 页 不 在 内 存 中 时 , 则 发 生 * 缺 页 异常。 计算 机 硬件 通过 检查 页 表 项 中 的 
“有 效 位 ”就 可 以 判断 是 否 “ 缺 页 ”。 

交换 (Swapping)/ 页 面 调度 (Paging) 

缺 页 时 ,需要 把 所 缺 页 面 从 磁盘 调 到 主 存 中 ,这 个 过 程 称 为 “页 面 换 人 ”( 或 “磁盘 调 
人 ”) ; 当 需 要 从 主 存 淘汰 一 页 到 磁盘 时 , 称 为 “页 面 换 出 ”( 或 “ 调 出 磁盘 ”)。 页 面 换 人 / 换 出 
称 为 交换 (Swapping) 或 页 面 调度 (Paging)。 

按 需 调度 页 面 (Demand Paging) 

只 有 发 生 “ 缺 页 ”时 才 换 和 人 页面。 大 部 分 现代 计算 机 系统 都 使 用 这 种 策略 进行 存储 
管理 。 

LRU 页 (Least Recently Used Page) 

指 最 近 最 少 使 用 的 页 。 通 过 检查 “使 用 位 ”可 以 找到 LRU 页 。 

快 表 (Translation Lookaside Buffer, TLB) 

用 一 个 特殊 的 cache 来 跟踪 记录 最 近 用 过 的 页 表 表 项 。 因 为 页 表 表 项 主要 用 于 地 址 转 
换 , 所 以 把 这 种 特殊 的 cache 称 为 转换 后 援 缓冲 器 (Translation Lookaside Buffer, TLB)。 
因为 在 TLB 中 查找 页 表 项 速度 很 快 ,所 以 也 称 TLB 为 快 表 。TLB 通常 很 小 ,在 高 端 机 器 
中 也 通常 不 超过 128 一 256 项 ,一 般 用 全 相 联 方式 ,中 等 性 能 机 器 多 用 小 的 组 相 联 方式 。 

分 页 式 虚 拟 存储 器 (Paging VM) 

分 页 式 虚 拟 存储 器 的 主要 思想 是 ,把 主 存储 器 分 成 固定 长 且 比 较 小 的 存储 块 ( 称 为 页 
框 ,Page Frame) ,虚拟 地 址 空间 也 被 划分 成 等 长 的 程序 块 ( 称 为 页 ,Page)。 操 作 系 统 把 当 
前 用 到 的 页 装 人 空闲 的 主 存 存 储 块 中 。 所 以 分 页 方式 是 按 固定 长 的 页 进行 分 配 和 调度 的 。 
逻辑 地 址 由 页 号 和 页 内 偏 移 量 组 成 。 

分 段 式 虚 拟 存 储 器 (Segmentation VM) 

分 段 式 虚拟 存储 器 与 分 页 式 虚 拟 存储 器 不 同 。 分 页 式 使 用 固定 大 小 的 块 进行 管理 ,而 
分 段 方式 采用 变 长 块 的 机 制 管理 存储 器 。“ 段 ?是 按照 程序 的 逻辑 结构 划分 面 成 的 多 个 相对 
独立 的 部 分 。 例 如 ,过 程 . 子 程序 .数据 表 、 阵 列 等 。 操 作 系统 在 进行 虚拟 空间 和 主 存 空 间 对 
应 时 , 按 程 序 中 实际 的 段 来 分 配 主 存 空间 ,每 个 段 在 主 存 中 的 起 始 位 置 记录 在 段 表 中 ,并 附 
以 “ 段 长 ?项 。 段 表 本 身 也 是 主 存 中 的 一 个 可 再 定位 段 。 一 个 大 程序 由 多 个 代码 段 和 多 个 数 
据 段 构成 。 人 逻辑 地 址 由 段 号 和 段 内 地 址 组 成 。 

段 页 式 虚 拟 存储 器 (Paged Segmentation VM) 

分 段 和 分 页 相 结合 的 方式 。 程 序 按 独 立 模块 分 段 , 段 内 再 分 成 固定 大 小 的 页 , 主 存 分 配 
时 仍 以 页 为 基本 单位 。 用 段 表 和 页 表 ( 每 段 一 个 ) 进 行 两 级 定位 管理 。 逻 辑 地 址 由 段 地 址 、 
页 地 址 和 偏 移 量 3 个 字段 构成 。 根 据 段 地 址 到 段 表 中 查阅 与 该 段 相应 的 页 表 指 针 ,转向 页 
表 , 然 后 根据 页 地 址 从 页 表 中 查 到 该 页 在 主 存 中 的 实 页 号 ,与 偏 移 量 相 加 得 到 物理 地 址 。 
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进程 (Process) 

进程 是 程序 在 系统 中 某 个 数据 集合 上 的 一 次 动态 运行 。 当 你 运行 一 个 程序 ,就 启动 了 
一 个 进程 ,同一 个 程序 在 不 同 的 数据 集 上 运行 构成 不 同 的 进程 。 进 程 是 操作 系统 进行 资源 
分 配 的 单位 。 当 某 一 个 进程 占用 CPU 执行 , 则 该 进程 是 活动 进程 (Active Process) ,否则 是 
非 活动 进程 (Inactive Process) 。 操 作 系统 通 过 把 进程 的 状态 装 人 相应 的 状态 单元 来 使 某 
个 进程 被 激活 。 

管理 模式 (Supervisor Mode) 

凡是 用 于 完成 操作 系统 各 种 功能 的 进程 就 是 系统 进程 ,也 称 为 内 核 (Kernel) 进 程 . 管 理 
(Supervisor) 进 程 。 此 时 ,处 理 器 所 处 的 模式 称 为 管理 模式 (Supervisor Mode) ,或 称 管理 程 
序 状态 ,简称 管 态 、 管 理 态 、 核 心态 。 

用 户 模 式 (User Mode) 

非 操 作 系 统 功 能 的 进程 称 为 用 户 进程 , 当 系 统 运行 用 户 进 程 时 ,处 理 器 的 模式 就 是 用 户 
模式 ,或 称 用 户 状 态 、 目 标 程序 状态 ,简称 为 目 态 。 

系统 调用 (System Call) 

系统 调用 使 CPU 从 用 户 态 转换 到 管理 态 。 系 统 调用 指令 是 一 种 特殊 的 指令 ,执行 这 
种 指令 后 ,CPU 就 调 出 特定 的 操作 系统 内 核 模 块 进行 执行 ,进入 管理 态 。 在 管 态 下 ,操作 系 
统 可 以 执行 专门 的 管 态 指令 (或 称 特 权 指 令 , 用 户 程 序 不 能 使 用 这 些 指令 ) 来 对 一 些 用 户 进 
程 不 能 访问 的 系统 状态 位 或 控制 位 进行 读 写 。 

异常 返回 (Return From Exception) 

异常 返回 指令 用 于 从 操作 系统 内 核 进程 返回 到 用 户 进程 。 通 过 系统 调用 进入 操作 系统 
内 核 时 , 需 保 留 系 统 调用 指令 后 面 一 条 指令 的 地 址 ,所 以 用 异常 返回 指令 返回 用 户 进程 时 ， 
可 以 根据 该 地 址 进行 返回 。 

存储 保护 (Protection) 

采用 虚拟 存储 髓 的 系统 中 ,可 以 实现 多 道 程序 运行 ,也 就 是 说 ,在 一 个 主 存 物理 空间 中 
同时 有 多 个 进程 共存 。 为 避免 主 存 中 多 道 程序 相互 干扰 ,防止 某 进程 出 错 而 破坏 其 他 进程 
的 正确 性 ,或 某 进程 不 合法 地 访问 其 他 进程 的 存储 区 ,应 对 每 个 进程 进行 存储 保护 。 存 储 保 
护 包含 两 个 方面 : (1) 地 址 越界 , 即 访问 了 不 该 访问 的 区 域 ; (2) 访 问 越权 , 即 进行 了 不 该 进 
行 的 存 取 操作 。 


4.4 常见 问题 解答 


1. ROM 和 RAM 一 样 ,都 是 随机 存 取 存 储 器 吗 ? 

答 : 是 的 。 虽 然 经 常 把 只 读 存储 器 ROM 和 随机 访问 存储 器 RAM 放 在 一 起 进行 分 类 ， 
但 ROM 的 存 取 方 式 和 RAM 是 一 样 的 ,都 是 通过 对 地 址 进行 译 码 后 选择 某 个 单元 进行 读 
写 。 所 以 两 者 采用 的 都 是 随机 存 取 方式 。 不同 的 是 ,ROM 是 只 读 的 ,RAM 是 可 读 可 写 的 。 
在 程序 执行 过 程 中 ,ROM 存储 区 只 能 读 出 信息 ,不 能 修改 ,而 RAM 区 可 以 读 出 ,也 可 以 修 
改 信息 。 

2. 寄存 器 和 主 存储 器 都 是 用 来 存放 信息 的 ,它们 有 什么 不 同 ? 

答 : 寄存 器 在 CPU 中 ,用 触发 器 来 实现 ,速度 极 快 ,价格 高 ,容量 只 有 几 十 个 ,多 的 机 器 
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也 通常 只 有 几 百 个 或 几 千 个 ,主要 用 来 暂 存 指令 运行 时 的 操作 数 和 结果 。 
主 存储 器 在 CPU 之 外 ,用 MOS 管 电路 实现 ,速度 没有 寄存 器 快 ,价格 也 比 寄存 器 便 
宜 , 容 量 可 以 达到 GB 数量 级 ,用 来 存放 被 启动 执行 的 程序 代码 及 其 数据 。 

3. 存 取 时 间 Ta 就 是 存储 周期 Tm 吗 ? 

答 : 不 是 。 存 取 时 间 Ta 是 执行 一 次 读 操作 或 写 操作 的 时 间 , 分 为 读 出 时 间 和 写 人 时 
间 。 读 出 时 间 为 从 主 存 接收 到 有 效 地 址 开始 到 数据 取出 有 效 为 止 的 最 短 时 间 ; 写 人 时 间 是 
从 主 存 接收 到 有 效 地 址 开始 到 数据 写 人 被 写 单 元 为 止 的 最 短 时 间 。 存 储 周 期 Tm 是 指 存储 
器 进行 连续 两 次 独立 的 读 或 写 操作 所 需要 的 最 小 时 间 间 隔 。 所 以 存 取 时 间 Ta 不 等 于 存储 
周期 Tm。 通 常 存 储 周 期 Tm 大 于 存 取 时 间 Ta。 

4. 刷新 和 再 生 是 一 回 事 吗 ? 

答 : 不 是 一 回 事 。 对 某 个 单元 的 刷新 和 再 生 的 操作 过 程 是 一 样 的 , 即 读 后 恢 复 , 但 再 生 
操作 是 随机 的 ,只 对 所 读 单元 进行 ,而 刷新 操作 则 是 按 顺序 定时 一 行 一 行进 行 的 。 

5. 刷新 是 一 个 个 芯片 按 顺 序 完 成 的 吗 ? 

答 : 不 是 。 刷 新 按 行 进行 ,每 一 行 中 的 记忆 单元 同时 被 刷新 ,因此 仅 需 要 行 地 址 ,不 需 
要 列 地 址 。 刷 新 行 号 由 DRAM 芯片 的 刷新 控制 电路 中 的 刷新 计数 器 产生 。 存 储 器 中 的 所 
有 芯片 的 相同 行 同 时 进行 刷新 ,例如 ,车 有 8 个 1024X1024X4 的 DRAM 芯片 构成 一 个 存 
储 器 , 则 只 需要 1024 次 刷新 操作 就 可 以 把 整个 存储 器 刷新 一 遍 。 

6, 主 存 都 是 由 RAM 组 成 的 吗 ? 

答 : 不 是 。 主 存 是 由 RAM 和 ROM 两 部 分 组 成 的 ,它们 统一 编 址 ,分 别 占用 不 同 的 地 
址 范围 。 

7. 程序 员 是 否 需要 知道 高 速 缓存 (cache) 的 访问 过 程 ? 

答 : 不 需要 。cache 的 访问 过 程 对 程序 员 来 说 是 透明 的 。 执 行 到 一 条 指令 时 ,需要 到 内 
存 取 指 令 ,有些 指令 还 要 访问 内 存 读 取 操 作 数 或 存放 运算 结果 。 采 用 cache 的 计算 机 系统 
中 ,总 是 先 到 cache 去 访问 指令 或 数据 ,没有 找到 才 到 主 存 去 访问 。 这 个 过 程 是 CPU 在 执 
行 指 令 过 程 中 自动 完成 的 。 程 序 员 不 需要 知道 要 找 的 指令 和 数据 在 不 在 cache 中 、 在 cache 
的 哪 一 行 , 也 不 需要 知道 cache 的 访问 过 程 ,只 要 在 指令 中 指定 存储 单元 地 址 就 行 了 。 事 实 
上 ,现代 计算 机 都 采用 虚拟 存储 器 机 制 ,所 以 ,在 程序 员 编 写 的 程序 或 编译 链接 生成 的 程序 
中 ,指令 给 出 的 地 址 还 不 是 真正 的 内 存单 元 地 址 ,而 是 一 个 虚拟 地 址 或 逻辑 地 址 ,操作 系统 
或 硬件 需要 对 程序 进行 重 定位 ,以 “页 ”或 “ 段 ” 为 单位 把 程序 装载 到 内 存 中 ,并 把 逻辑 地 址 转 
换 为 真正 的 内 存 地 址 (物理 地 址 )。 

8. 主 存 和 cache 之 间 分 块 传送 数据 时 ,是 否 主 存 块 越 大 ,命中 率 越 高 ? 

答 : 不 是 。 主 存 块 大 可 充分 利用 程序 访问 的 空间 局 部 性 特点 ,使 得 一 个 比较 大 的 局 部 
空间 被 一 起 调 到 cache 中 ,因而 可 以 增加 命中 机 会 。 但 是 , 主 存 块 不 能 太 大 ,主要 原因 有 两 
个 : (1) 块 大 使 得 缺失 损失 变 大 ,因为 需 花 费 更 多 时 间 从 主 存 读 一 个 较 大 的 块 。(2) 块 大 则 
cache 行 数 变 少 , 因 而 替换 可 能 性 增加 ,导致 命中 的 可 能 性 变 小 。 

9. 指令 和 数据 都 是 放 在 同一 个 cache 中 的 吗 ? 

答 : 现代 计算 机 系统 中 ,一 般 采 用 多 级 cache 系统 。CPU 执行 指令 时 , 先 到 速度 最 快 的 
一 级 cache(L1 cache) 中 寻找 指令 或 数据 , 找 不 到 时 ,再 到 速度 次 快 的 二 级 cache(L2 cache) 
中 找 , 以 此 类 推 ,最 后 到 主 存 中 找 。 对 于 一 级 cache, 指 令 和 数据 一 般 分 开 存 放 , 而 二 级 cache 
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| 的 指令 和 数据 是 放 在 一 起 的 。 因 此 ,有 L1 data cache 和 L1 code cache。 
| 10，eache 可 以 装 在 CPU 芯片 中 吗 ? 

答 : 可 以 。 早 期 的 计算 机 ,其 cache 是 装 在 主板 上 的 。 但 随 着 CPU 芯片 技术 的 提高 ， 
cache 可 以 装 在 CPU 中 。 从 逻辑 上 来 说 ,cache 是 位 于 CPU 和 主 存 之 间 的 部 件 , 但 在 物理 
上 ,cache 被 封装 在 CPU 芯片 内 。 目 前 ,一 级 cache、 二 级 cache, 甚 至 三 级 cache 都 可 以 封装 
在 CPU 芯片 中 。 

11, 直接 映射 方式 下 是 否 需要 考虑 替换 策略 ? 为 什么 ? 

答 : 无 须 考虑 。 因 为 在 直接 映射 方式 下 ,一 个 给 定 的 主 存 块 只 能 映射 到 一 个 固定 的 
cache 行 中 ,所 以 ,在 对 应 cache 行 中 已 有 一 个 主 存 块 的 情况 下 ,新 的 主 存 块 毫 无 选择 地 把 原 
先 已 有 的 那个 主 存 块 替换 掉 , 因 而 无 须 考虑 替换 算法 。 

12. 在 CPU 和 主 存 之 间 加 入 了 多 个 cache, 计算机 总 存储 量 就 增加 了 ,对 吗 ? 

答 : 不 对 。 虽 然 cache 是 存储 器 ,具有 几 百 KB 甚至 几 MB 的 容量 ,但 因为 它 存放 的 是 
主 存 信息 的 副本 ,所 以 ,并 不 能 增加 系统 的 存储 容量 。 

13， 怎样 保证 CPU 要 找 的 指令 和 数据 大 都 能 在 cache 中 访问 到 呢 ? 

答 : 根据 程序 访问 的 局 部 性 特点 可 知 , 不 管 是 访问 指令 还 是 数据 ,CPU 在 执行 程序 的 
过 程 中 , 若 某 个 地 址 在 工时 刻 被 访问 , 则 该 地 址 及 其 邻近 地 址 在 T 十 At 时 间 段 内 很 可 能 也 
被 访问 。 因 而 ,在 访问 到 每 个 内 存 地 址 时 ,把 该 地 址 及 其 邻近 的 内 存单 元 内 容 ( 即 一 个 主 存 
块 ) 一 起 复制 到 cache 中 。 这 样 ,在 接 下 来 的 一 段 时 间 内 ,CPU 所 要 访问 的 指令 或 数据 基本 
上 能 在 cache 中 找到 了 。 

14， CPU 要 找 的 指令 和 数据 都 能 在 cache 中 访问 到 吗 ? 为 什么 ? 

答 : 不 能 。 指 令 / 数 据 在 第 一 次 被 访问 时 ,肯定 不 在 cache 中 ,因而 在 cache 中 访问 不 
到 。 此 时 ,就 会 把 所 访问 的 指令 /数据 所 在 的 主 存 块 从 主 存 取 到 cache 中 ,这 样 ,只 要 这 个 主 
存 块 不 被 其 他 主 存 块 替换 ,以 后 再 访问 这 个 数据 /指令 或 者 同一 块 中 其 他 数据 /指令 时 ,就 能 
在 cache 中 命中 了 。 但 是 , 随 着 程序 的 执行 ,CPU 所 访问 的 地 址 区 域 会 移 到 另外 的 主 存 块 。 
由 于 cache 容量 的 限制 , 当 新 的 主 存 块 调 人 cache 时 ,原来 在 cache 中 的 主 存 块 很 可 能 被 新 
的 主 存 块 替 换 出 来 。 如 果 蔡 换 出 来 后 ,CPU 又 要 对 其 进行 访问 ,那么 ,CPU 在 cache 中 肯定 
找 不 到 。 所 以 ,CPU 要 找 的 指令 和 数据 不 可 能 总 在 cache 中 访问 到 。 

15. 发 生 取 指 令 缺 失 时 的 处 理 步骤 是 什么 ? 

答 : 每 条 指令 执行 的 第 一 步 是 取 指 令 。 若 在 cache 中 取 当 前 指令 时 发 生 缺 失 , 则 处 理 
器 必须 按 如 下 步骤 完成 : (1) 把 程序 计数 器 的 内 容 恢 复 为 当前 指令 的 地 址 ,并 通过 地 址 线 送 
主 存储 器 。(2)? 控 制 主 存储 器 执行 一 次 读 操 作 ( 若 一 个 主 存 块 只 有 一 条 指令 , 则 一 次 读 操作 
读 一 条 指令 即 可 ; 若 一 个 主 存 块 占用 多 条 指令 , 则 控制 一 次 读 出 多 条 指令 或 读 若干 次 ) ,对 主 
存 的 访问 要 通过 总 线 完成 ,一 次 总 线 事务 完成 一 次 读 操 作 。(3) 读 出 的 指令 写 到 cache 中 ， 
并 把 主 存 地 址 的 高 位 写 人 到 cache 行 的 标记 字段 ,最 后 设置 有 效 位 。(4) 重 新 执行 当前 指令 
的 第 一 步 操 作 , 即 取 指 令 , 这 次 在 cache 中 取 指 令 时 便 能 命中 。 

16. 引入 cache 后 ,CPU 的 数据 通路 和 控制 部 件 要 增加 哪些 功能 和 相关 的 电路 ? 

答 : 在 指令 执行 过 程 中 ,CPU 必须 从 存储 器 取 指 令 , 有 些 指令 还 要 从 存储 器 取 操 作 数 ， 
或 把 结果 写 到 存储 器 中 。CPU 总 是 先 到 L1 cache 中 寻找 , 找 不 到 再 从 L2 cache 或 主 存 中 
找 。 所 以 ,在 指令 执行 过 程 中 ,控制 部 件 必须 能 够 检测 访问 有 没有 命中 。 实 现 这 个 功能 只 要 
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用 若干 比较 器 和 一 些 门 电路 即 可 。 若 命中 , 则 直接 在 cache 中 访问 即 可 。 若 缺失 , 则 处 理 器 
需要 进行 一 系列 的 处 理 。 包 括 : 使 当前 指令 暂时 停止 执行 ,并 冻结 所 有 寄存 器 ,然后 用 一 个 
专门 的 控制 器 控制 从 下 一 级 cache 或 主 存 中 将 当前 访问 地 址 所 在 的 一 个 主 存 块 送 到 cache 
中 ,并 设置 有 效 位 和 标志 (Tag) 信 息 ,最 后 重新 从 暂停 执行 的 时 钟 周 期 开始 执行 指令 。 

17. 写 操作 处 理 和 读 操 作 处 理 有 什么 不 同 ? 

答 : 因为 读 操作 不 改变 cache 中 的 信息 ,所 以 , 读 操 作 时 的 缺失 处 理 比较 简单 。 只 要 把 
主 存 块 从 主 存 装 人 cache 中 即 可 。 而 写 操作 时 会 改变 cache 中 的 信息 ,造成 cache 数据 和 主 
存 数 据 的 不 一 致 。 因 此 ,要 有 相应 的 写 策略 来 解决 这 种 “不 一 致 性 ”。 

18，cache 缺失 对 指令 的 执行 有 影响 吗 ? 有 怎样 的 影响 ? 

答 : cache 缺失 对 指令 的 执行 效率 有 很 大 影响 ,会 大 大 延长 指令 的 执行 时 间 。 延 长 多 少 
由 缺失 损失 决定 。 若 从 L2 cache 取 , 一 般 需 要 5 一 10 个 时 钟 周期 , 若 从 主 存 取 , 需 要 25 一 
100 个 时 钟 周期 。 执 行 一 条 指令 时 的 缺失 情况 有 以 下 几 种 可 能 : (1) 取 指令 时 缺失 ,此 时 ， 
从 L2 cache 或 主 存 取出 指令 或 指令 所 在 的 一 个 主 存 块 放 到 cache 后 ,再 从 头 开始 重新 执行 
指令 ;(2) 读 数据 时 缺失 ,此 时 ,从 L2 cache 或 主 存 取 出 数据 或 数据 所 在 的 一 个 主 存 块 到 
cache 后 ,从 取 数 那个 时 钟 周 期 开始 执行 指令 ;(3) 写 数据 时 缺失 ,此 时 ,需要 根据 相应 的 写 
策略 来 决定 是 当时 就 更 新 主 存 的 数据 还 是 在 主 存 块 被 替换 时 更 新 主 存 的 数据 。 存 数 操作 结 
束 后 指令 也 就 执行 完了 。 

如 果 一 条 指令 执行 过 程 中 , 婚 发 生 取 指 令 缺失 又 发 生 取 数 或 存 数 缺失 ,那么 ,这 条 指令 
的 执行 将 要 延长 多 个 缺失 损失 的 时 间 。 也 就 是 说 ,可 能 会 延长 几 十 到 几 百 个 时 钟 周期 。 在 
流水 线 方式 下 ,会 大 大 影响 指令 的 执行 。 

19. 虚拟 存储 器 的 大 小 是 否 等 于 磁盘 的 容量 加 上 内 存 的 容量 ? 

答 : 不 是 。 虚 拟 存储 器 本 身 只 是 一 个 概念 ,是 一 种 存储 管理 机 制 , 使 用 这 种 机 制 使 得 程 
序 员 编 写 程序 时 ,好 像 计 算 机 内 部 有 一 个 极 大 的 存储 器 ,程序 在 这 个 极 大 的 存储 器 中 运行 ， 
而 不 受 内 存 大 小 的 限制 。 实 际 上 这 个 存储 器 在 物理 上 是 不 存在 的 ,因此 称 为 “虚拟 ?存储 器 。 
虚拟 存储 器 的 大 小 就 是 虚拟 (或 逻辑 ) 地 址 空间 的 大 小 , 它 由 逻辑 地 址 的 位 数 决定 ,与 系统 中 
所 安装 的 磁盘 容量 和 内 存 容 量 没 有 直接 的 关系 。 

20. 在 存储 器 层次 结构 中 ,“cache 一 主 存 ”、“ 主 存 一 辅 存 ” 这 两 个 层次 有 何 异同 点 ? 

答 : 这 两 个 层次 在 以 下 几 个 方面 有 相同 之 处 :1) 都 是 基于 程序 访问 的 局 部 性 特点 ,把 
连续 的 一 块 局 部 信息 从 慢 速 存储 器 复制 到 快速 存储 器 ; (2) 都 必须 考虑 慢 速 存 储 器 和 快速 存 
储 器 之 间 的 映射 问题 ;(3) 当 需 要 在 快速 存储 器 中 装 人 新 的 块 而 对 应 位 置 已 满 时 ,都 需要 考 
虑 把 哪 一 块 从 快速 存储 器 中 蔡 换 出 来 ;(4)? 当 在 快速 存储 器 中 找 不 到 信息 时 ,都 要 从 慢 速 存 
储 器 中 将 该 信息 所 在 块 装 人 快速 存储 器 中 。 

因为 这 两 个 层次 所 处 的 位 置 和 引入 的 目的 不 同 ,所 以 它们 之 间 也 存在 许多 不 同 之 处 : 
(1) 位 置 不 同 。cache 最 靠近 CPU, 辅 存 最 远离 CPU,CPU 可 以 直接 访问 cache 和 主 存 , 但 
不 能 直接 访问 辅 存 , 辅 存 和 主 存 直接 交换 数据 。(2) 目 的 不 同 。 在 CPU 和 主 存 之 间 加 入 
cache, 目 的 是 为 了 加 快 CPU 访问 信息 的 速度 ;而 在 主 存 一 辅 存 层次 采用 虚拟 存储 器 机 制 是 
为 了 使 程序 员 写 程序 时 不 受 内 存 容 量 的 限制 。 即 扩大 系统 的 存储 容量 。(3) 交 换 的 信息 块 
大 小 不 同 。 在 “cache 一 主 存 ?层次 ,交换 的 信息 块 称 为 “ 主 存 块 (Block)”, 一 般 大 小 为 8 一 128 
字 节 ;而 在 “ 主 存 一 辅 存 ”层次 ,交换 的 信息 块 称 为 “虚拟 页 (Page)”, 一 般 大 小 为 4K~64K 字 
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| 节 。 随 着 技术 的 发 展 , 块 大 小 和 页 大 小 都 可 能 变化 ,但 它们 之 间 在 数量 级 上 的 差别 总 是 存在 
| 的 ,而 且 会 很 大 。 因 为 虚拟 页 缺失 损失 比 cache 缺失 损失 大 得 多 ,所 以 虚拟 页 太 小 会 影响 命 
中 率 从 而 极 大 降低 系统 效率 。(4) 缺 失 处 理 不 同 。 在 “cache 一 主 存 ? 层 次 ,缺失 处 理由 处 理 
器 硬件 来 实现 ;而 在 “ 主 存 一 辅 存 ” 层 次 , 则 由 操作 系统 软件 来 实现 。(5) 映 射 方 式 不 同 。 在 
“cache 一 主 存 ”层次 ,可 根据 不 同 的 情况 选择 使 用 直接 、 全 相 联 或 组 相 联 方式 ,映射 关系 完全 
由 硬件 来 实现 ;而 在 “ 主 存 一 辅 存 ?层次 , 则 都 采用 全 相 联 方式 ,映射 关系 由 操作 系统 查询 页 
表 来 实现 。(6) 写 策略 不 同 。 在 “cache 一 主 存 ” 层 次 ,可 以 采用 “全 写 ” 和 “ 回 写 ” 两 种 策略 ;但 
在 “ 主 存 一 辅 存 ” 层 次 , 则 都 采用 “ 回 写 ” 策 略 。 因 为 ,如 果 采 用 “全 写 ”, 每 次 写 操作 都 要 访问 
磁盘 ,这 样 的 开销 是 不 能 容忍 的 。 

21， 所 有 程序 都 具有 同样 的 虚拟 地 址 空间 ,会 不 会 发 生 信息 被 互相 读 写 的 情况 呢 ? 

答 : 不 会 。 虚 拟 存储 机 制 使 得 每 个 程序 员 在 一 个 很 大 的 虚拟 地 址 空间 中 编写 程序 ,不 
必 考 虑 主 存 有 多 大 ,也 不 必 考 虑 其 他 程序 用 的 地 址 是 否 和 自己 用 的 地 址 有 冲突 。 也 就 是 说 ， 
每 个 程序 都 具有 同样 的 虚拟 地 址 空间 。 用 户 程序 加 载 后 ,操作 系统 内 核 会 为 该 程序 生成 一 
个 进程 。 在 进程 执行 过 程 中 ,操作 系统 会 按照 某 种 存储 管理 机 制 (分 段 、 分 页 、 段 页 ) 把 当前 
需要 的 用 户 程 序 的 一 部 分 从 磁盘 调 到 主 存 中 ,并 把 所 在 的 物理 地 址 信息 记录 到 段 表 或 页 表 
中 ,进行 虚拟 地 址 空间 到 物理 地 址 空间 的 映射 。 因 此 ,CPU 访问 信息 的 真正 地 址 是 主 存 物 
理 地 址 。 虽然 两 个 用 户 程 序 中 用 到 的 逻辑 地 址 是 一 样 的 ,但 由 于 两 个 用 户 程 序 被 存放 到 不 
同 的 物理 主 存 区 ,因而 ,不 会 发 生 信 息 被 互相 读 写 的 问题 ,即使 由 于 程序 错误 而 导致 这 种 问 
题 也 很 容易 发 现 。 

22， 装 入 一 个 新 的 页 面 时 , 主 存 没 有 空闲 页 框 , 怎 么 办 ? 

答 : 装 人 一 个 新 页 时 ,需要 到 主 存 找 一 个 空闲 页 框 。 如 果 主 存 没 有 空闲 页 框 , 则 必须 选 
择 一 个 虚拟 页 面 从 主 存 的 某 个 页 框 中 替换 出 来 。 

23. 怎么 知道 要 找 的 页 面 不 在 内 存 ? 

答 : 所 谓 要 找 的 页 面 不 在 内 存 , 实 际 上 就 是 在 取 某 条 指令 或 存 取 某 个 操作 数 时 ,发 生 了 
“ 缺 页 ”情况 。 是 否 “ 缺 页 ”主要 是 通过 查看 对 应 页 表 项 中 的 “有 效 位 ”是 否 为 “0” 来 判断 。 大 
致 过 程 如 下 : 根据 要 找 的 指令 或 操作 数 的 地 址 高 位 ,确定 所 访问 的 虚 页 号 ,以 虚 页 号 作为 索 
引 值 , 找 到 对 应 的 页 表 项 ,每 个 页 表 项 中 都 有 一 个 有效 位 >, 若 为 “0 表示 该 虚 页 ( 即 指令 所 
在 的 程序 块 或 操作 数 所 在 的 数据 块 ) 不 在 内 存 , 发 生 了 “ 缺 页 ”异常 。 

24， 每 次 进行 存储 访问 时 ,总 是 先 要 进行 逻辑 地 址 到 物理 地 址 的 转换 吗 ? 

答 : 如 果 采 用 的 是 动态 重 定 位 , 则 执行 指令 过 程 中 只 要 进行 存储 访问 ,总 是 先 要 进行 逻 
辑 地 址 到 物理 地 址 的 转换 。 如 果 采 用 的 是 静态 重 定位 , 则 指令 中 的 地 址 已 经 是 物理 地 址 , 故 
存储 访问 时 不 需要 地 址 转换 。 

25， 逻辑 地 址 到 物理 地 址 的 转换 是 由 硬件 实现 的 还 是 软件 实现 的 ? 

答 : 动态 重 定位 方式 下 ,由 专门 的 硬件 (存储 器 管理 部 件 MMU) 实 现 逻辑 地 址 到 物理 
地 址 的 转换 。 静 态 重 定位 方式 下 ,由 软件 (链接 程序 或 加 载 程序 ) 实 现 地 址 转换 。 

26. 快 表 (TLB) 在 主 存 还 是 在 高 速 缓存 中 ? 

答 : 为 了 尽量 避免 到 主 存 访问 页 表 , 通 常 把 最 近 经 常 访问 的 页 表 项 放 到 一 个 特殊 的 高 
速 缓存 中 ,这 个 存放 若干 页 表 项 的 特殊 cache 称 为 快 表 TLB。 所 以 , 快 表 在 高 速 缓存 中 。 
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27， CPU 执行 指令 进行 一 次 存储 访问 操作 要 访问 主 存 几 次 ? 

答 : 在 具有 cache 并 采用 动态 重 定位 存储 管理 的 系统 中 ,一 次 存储 访问 的 大 致 过 程 
如 下 : 

(1) 根据 虚 页 号 查 快 表 , 若 快 表 中 有 对 应 虚 页 的 页 表 项 , 则 取出 页 框 号 形成 物理 地 址 ， 
转 (2); 若 快 表 中 不 存在 对 应 虚 页 的 页 表 项 , 则 发 生 TLB 缺失 , 转 (3) 。 

(2) 判断 物理 地 址 中 的 标记 是 否 和 cache 中 标记 相等 并 且 有 效 位 是 否 为 “1”, 是 , 则 
cache 命中 ,从 cache 取 数 或 写 数据 到 cache(“ 全 写 ? 方 式 下 ,同时 也 写 主 存 ) 中 ;不 是 , 则 发 生 
cache 缺失 , 转 (4) 。 

(3) 当 TLB 缺失 时 ,根据 页 表 基 址 寄存 器 的 值 和 虚 页 号 找到 主 存 中 的 页 表 项 ,判断 有 
效 位 是 否 为 “1”, 若 是 , 则 说 明 该 虚 页 在 主 存 中 ,此 时 ,把 该 页 表 项 装 和 人 TLB 中 ,并 取出 页 框 
号 形成 物理 地 址 , 转 (2) ;车 不 是 , 则 说 明 该 虚 页 不 在 主 存 中 , 即 发 生 了 “ 缺 页 ”异常 。 此 时 , 需 
要 调 出 操作 系统 中 的 “ 缺 页 ”异常 处 理 程序 ,实现 从 磁盘 读 人 一 个 页 面 的 功能 .。“ 缺 页 ”处 理 
结束 后 ,重新 执行 当前 指令 ,这 次 一 定 能 在 主 存 中 找到 。 

(4) cache 缺失 时 ,CPU 根据 物理 地 址 到 主 存 读 一 块 信息 到 cache, 然后 再 读 人 到 CPU 
或 CPU 写 信 息 到 cache 中 。 

从 上 述 过 程 来 看 ,CPU 进行 一 次 存储 访问 操作 ,最 好 的 情况 下 无 须 访问 主 存 ,最 坏 的 情 
况 下 ,不仅 要 多 次 访问 主 存 ,还 要 读 写 磁盘 数据 。 

28， 具有 TLB、cache 和 虚拟 存储 管理 机 制 的 计算 机 系统 中 ,有 没有 可 能 出 现 “cache 命 
中 但 缺 页 ”的 情况 ? 那 “TLB 命中 但 缺 页 ”的 情况 有 没有 可 能 发 生 呢 ? 

答 : 不 可 能 出 现 “cache 命中 但 缺 页 ”的 情况 。 因 为 如 果 缺 页 ,说 明 当 前 页 面 不 在 主 存 
中 ,那么 ,也 一 定 不 在 cache 中 。 同 样 ,“TLB 命中 但 缺 页 ”的 情况 也 不 可 能 发 生 。 因 为 若 当 
前 页 面 不 在 主 存 中 ,那么 ,TLB 中 不 可 能 有 该 页 对 应 的 页 表 项 。 

29. 快 表 缺 失 、cache 缺失 和 页 面 缺失 ( 缺 页 ) 的 处 理 有 什么 异同 点 ? 

答 : cache 缺失 的 处 理 是 由 硬件 实现 的 。 当 发 生 cache 缺失 时 ,CPU 使 当前 指令 阻塞 ， 
并 根据 主 存 地 址 继续 到 主 存 中 去 访问 主 存 块 ,从 主 存 中 取 到 信息 后 指令 继续 执行 。 

TLB 缺失 可 以 用 软件 也 可 以 用 硬件 来 处 理 。 首 先 根据 虚 页 号 和 页 表 基 址 寄存 器 的 内 
容 到 主 存 中 找到 相应 的 页 表 项 ,车 有 效 位 为 “1”, 则 把 该 项 取 到 TLB 中 即 可 。 若 有 效 位 为 
“0”, 则 发 出 “ 缺 页 ”异常 。 用 软件 实现 时 ,通过 产生 一 个 “TLB 缺失 异常 ”, 调 出 操作 系统 中 
相应 的 异常 处 理 程序 ,异常 处 理 结束 后 ,重新 执行 当前 指令 。 

页 面 缺 失 ( 缺 页 ) 处 理 是 由 软件 实现 的 。 缺 页 时 ,需要 调 出 操作 系统 中 的 “ 缺 页 ?异常 处 
理 程 序 进 行 处 理 , 实 现 从 磁盘 读 人 一 个 页 面 的 功能 .“ 缺 页 ?处理 结 束 后 ,重新 执行 当前 
指令 。 

30. 存储 器 分 层 结构 中 ,各 层次 上 的 存储 器 的 速度 如 何 ? 

答 : 在 计算 机 系统 中 ,存储 器 采用 的 是 一 种 分 层 结 构 , 包 括 寄存 器 一 cache 一 主 存 一 磁 
盘 。 它 们 之 间 的 相对 速度 若 用 一 个 CPU 时 钟 周 期 来 表示 , 则 在 0 个 周期 内 就 能 从 寄存 器 访 
问 到 信息 ;在 1~10 个 时 钟 周 期 能 够 在 cache 中 访问 到 信息 ;在 50 一 100 个 时 钟 周期 能 在 主 
存 中 访问 到 信息 ;如 果 要 从 磁盘 读 信息 , 则 大 约 需要 几 十 万 到 几 百 万 个 时 钟 周期 。 因 此 , 程 
序 员 必须 能 够 充分 理解 存储 器 的 分 层 结构 , 它 对 程序 的 性 能 有 巨大 的 影响 。 随 着 技术 的 进 
步 各 种 存储 器 的 速度 可 能 会 发 生变 化 ,但 它们 之 间 的 差异 总 是 存在 的 。 
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| 4.5 单项 选择 题 


1. 下 面 有 关 半 导体 存储 器 组 织 的 氢 述 中 ,错误 的 是 ( )。 
A. 存储 器 的 核心 部 分 是 存储 体 ,由 若干 存储 单元 构成 
B. 存储 单元 由 若干 个 存放 0 或 1 的 存储 元 件 构成 
C. 一 个 存储 单元 有 一 个 编号 ,就 是 存储 单元 的 地 址 
D. 同一 个 存储 器 中 ,每 个 存储 单元 的 宽度 可 以 不 同 

2. 下 面 ( ” “) 存 储 器 是 目前 已 被 淘汰 的 存储 器 。 


A. 半导体 存储 器 B. 磁 表 面 存储 器 
C. 磁 芯 存储 器 D. 光盘 存储 器 
3. 若 计算 机 的 主 存储 器 容量 为 1GB ,也 就 等 于 ( ) 。 
A，2” 个 字 节 B. 10? 个 字 节 
C. 2 个 字 节 D. 10? 个 字 节 
4. 若 SRAM 芯片 的 容量 为 1024X4 位 , 则 地 址 和 数据 引 脚 的 数目 分 别 为 ( 2 
A. 10,4 B. 5,4 C. 10,8 D. 5,8 


5. 车 计算 机 字 长 16 位 , 主 存 地 址 空间 大 小 是 64KB, 按 字 节 编 址 , 则 主 存 寻 址 范围 是 
25 


A. 0~(64K—1) B. 0 一 (32K 一 1) 

C. 0 一 (64KB 一 1) D. 0 一 (32KB 一 1) 
6. EPROM 是 指 ( ) 。 

A. 读 写 存储 器 B. 掩 膜 只 读 存储 器 

C. 可 编程 的 只 读 存 储 器 D. 可 擦 除 可 编程 的 只 读 存 储 器 
7. 下 列 几 种 存储 器 中 ,人 ) 是 易 失 性 存储 器 。 

A. cache B. EPROM 

C. Flash Memory D. CD-ROM 


8. 假定 主 存 地 址 空间 大 小 为 1024MB, 按 字 节 编 址 ,每 次 读 写 操作 最 多 可 以 一 次 存 取 
32 位 。 不 考虑 其 他 因素 , 则 存储 器 地 址 寄存 器 MAR 和 存储 器 数据 寄存 器 MDR 的 位 数 至 
少 应 分 别 为 ( )。 


A. 30,8 B. 30,32 C. 28,8 D. 28,32 
9. 需要 定时 刷新 的 半导体 存储 器 芯片 是 ( )。 

A. SRAM B. DRAM C. EPROM D. Flash Memory 
10. 通常 采用 行列 地 址 引 脚 复 用 的 半导体 存储 器 芯片 是 ( )。 

A. SRAM B. DRAM C. EPROM D. Flash Memory 


11. 具有 RAS( 行 地 址 选 通 ) 和 CAS( 列 地 址 选 通 ) 信 号 引 脚 的 半导体 存储 器 巷 片 是 
( ), 
A. SRAM B. DRAM C. EPROM D. Flash Memory 
12. 下 面 有 关系 统 主 存储 器 的 叙述 中 ,错误 的 是 ( ”)。 
A. RAM 是 可 读 可 写 存储 器 ,ROM 是 只 读 存 储 器 
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B. ROM 和 RAM 都 采用 随机 访问 方式 进行 读 写 
C. 系统 的 主 存 由 RAM 和 ROM 组 成 
D. 系统 的 主 存 都 用 DRAM 芯片 实现 
13. 下 面 有 关 半 导体 存储 器 的 叙述 中 ,错误 的 是 (。 )。 
A. 半导体 存储 器 都 采用 随机 存 取 方式 进行 读 写 
B. ROM 芯片 属于 半导体 随机 存储 器 芯 
C. SRAM 是 半导体 静态 随机 访问 存储 器 ,可 用 作 cache 
D. DRAM 是 半导体 动态 随机 访问 存储 器 ,可 用 作 主 存 
14. 假定 用 若干 个 16KX1 位 的 存储 器 芯片 组 成 一 个 64KX8 位 的 存储 器 ,芯片 内 各 单 
元 连续 编 址 , 则 地 址 BFFOH 所 在 的 芯片 的 最 小 地 址 为 ( ) 。 
A. 4000H B. 6000H C. 8000H D. Ao00H 
15. 假定 用 若干 16K X8 位 的 存储 器 芯片 组 成 一 个 64KX8 位 的 存储 器 ,芯片 各 单元 交 
叉 编 址 , 则 地 址 BFFF 所 在 的 芯片 的 最 小 地 址 为 ( 3 
A. 0000H B. 0001H C. 0002H D. 0003H 
16. 用 存储 容量 为 16KX1 位 的 存储 器 芯片 组 成 一 个 64KX8 位 的 存储 器 , 则 在 字 方 向 
和 位 方向 上 分 别 扩展 了 ( “) 售 。 
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A.4 和 2 B.4 和 8 C. 2 和 4 D. 8 和 4 
17, 存储 容量 为 16KX4 位 的 DRAM 芯片 ,其 地 址 引 脚 和 数据 引 脚 数 各 是 (。”)。 
A.7 和 1 B.7 和 4 C. 14 和 1 D. 14 和 4 
18， 多 模块 存储 器 之 所 以 能 被 快速 访问 ,是 因为 (  )。 
A. 采用 了 高 速 元 器 件 B. 各 模块 有 独立 的 读 写 电路 
C. 采用 了 信息 防 读 技术 D. 模块 内 各 单元 地 址 不 连续 
19. 相 联 存储 器 是 按 ( 进行 寻 址 访问 的 存储 器 。 
A. 地 址 指定 方式 B. 内 容 指定 方式 
C. 堆栈 访问 方式 D. 队列 访问 方式 


20. 在 存储 器 分 层 体系 结构 中 ,存储 器 速度 从 最 快 到 最 慢 的 排列 顺序 是 ( 
A. 寄存 器 一 主 存 一 cache 一 辅 存 。 B. 寄存 器 一 主 存 一 辅 存 一 cache 
C. 寄存 器 一 cache 一 辅 存 一 主 存 ” D. 寄存 器 一 cache 一 主 存 一 辅 存 

21. 在 存储 器 分 层 体系 结构 中 ,存储 器 从 容量 最 大 到 最 小 的 排列 顺序 是 ( D3 
A. 主 存 一 辅 存 一 cache 一 寄存 器 。 B. 辅 存 一 cache 一 主 存 一 寄存 器 
C. 辅 存 一 主 存 一 cache 一 寄存 器 D. 辅 存 一 主 存 一 寄存 器 一 cache 

22. 在 主 存 和 CPU 之 间 增 加 cache 的 目的 是 ( )。 


A. 增加 内 存 容量 B. 提高 内 存 可 靠 性 
C. 加 快 信息 访问 速度 D. 增加 内 存 容 量 ,同时 加 快 访问 速度 


23. 以 下 哪 一 种 情况 能 很 好 地 发 挥 cache 的 作用 ? (  )。 
A. 程序 中 不 含有 过 多 的 IO 操作 
B. 程序 的 大 小 不 超过 实际 的 内 存 容量 
C. 程序 具有 较 好 的 访问 局 部 性 
D. 程序 的 指令 间 相关 度 不 高 
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24. 假定 主 存 地 址 位 数 为 32 位 , 按 字 节 编 址 , 主 存 和 cache 之 间 采 用 直接 映射 方式 , 主 
存 块 大 小 为 1 个 字 ,每 字 32 位 , 写 操作 时 采用 全 写 (Write Through) 方 式 , 则 能 存放 32K 字 
数据 的 cache 的 总 容量 至 少 应 有 多 少 位 ?( )。 

A. 1504K B. 1536K C. 1568K D. 1600K 

25. 假定 主 存 地 址 位 数 为 32 位 , 按 字 节 编 址 , 主 存 和 cache 之 间 采 用 直接 映射 方式 , 主 
存 块 大 小 为 1 个 字 , 每 字 32 位 , 写 操作 时 采用 回 写 (Write Back) 方 式 , 则 能 存放 32K 字数 据 
的 cache 的 总 容量 至 少 应 有 多 少 位 ?( 3 

A. 1504K B. 1536K C. 1568K D. 1600K 

26. 假定 主 存 地 址 位 数 为 32 位 , 按 字 节 编 址 , 主 存 和 cache 之 间 采 用 全 相 联 映射 方式 ， 
主 存 块 大 小 为 1 个 字 , 每 字 32 位 ,采用 回 写 (Write Back) 方 式 和 随机 替换 策略 , 则 能 存放 
32K 字数 据 的 cache 的 总 容量 至 少 应 有 多 少 位 ? 〈 六 

A. 1536K B. 1568K C. 2016K D. 2048K 

27. 假定 主 存 按 字 节 编 址 ,cache 共有 64 行 ,采用 直接 映射 方式 , 主 存 块 大 小 为 32 字 

节 , 所 有 编号 都 从 0 开始 。 问 主 存 第 3000 号 单元 所 在 主 存 块 对 应 的 cache 行 号 是 (。 )。 
A. 13 B. 26 C. 29 D. 58 

28. 假定 主 存 按 字 节 编 址 ,cache 共有 64 行 , 采 用 4 路 组 相 联 映射 方式 , 主 存 块 大 小 为 
32 字 节 ,所 有 编号 都 从 0 开始 。 问 主 存 第 3000 号 单元 所 在 主 存 块 对 应 的 cache 组 号 是 
( ) 。 

A. 1 用 C. 13 D. 29 

29. 假定 采用 单 体 存储 器 组 织 方式 ,CPU 通过 存储 器 总 线 读 取 数据 的 过 程 为 : 发 送 地 
址 和 读 命令 需 1 个 时 钟 周期 ,存储 器 准备 一 个 数据 需 8 个 时 钟 周期 ,总 线 上 每 传送 1 个 数据 
需 1 个 时 钟 周期 。 若 主 存 和 cache 之 间 交 换 的 主 存 块 大 小 为 64B, 存 取 宽 度 和 总 线 宽度 都 为 
4B, 则 cache 的 一 次 缺失 损失 至 少 为 多 少 个 时 钟 周期 ?《〈 更 

A， 64 B42 C. 80 D. 160 

30. 假定 采用 单 体 存 储 器 组 织 方式 ,CPU 通过 存储 器 总 线 读 取 数 据 的 过 程 为 : 发 送 地 
址 和 读 命令 需 1 个 时 钟 周期 ,存储 器 准备 一 个 数据 需 8 个 时 钟 周期 ,总 线 上 每 传送 1 个 数据 
需 1 个 时 钟 周期 。 若 主 存 和 cache 之 间 交 换 的 主 存 块 大 小 为 64B, 存 取 宽 度 和 总 线 宽度 都 为 
8B, 则 cache 的 一 次 缺失 损失 至 少 为 多 少 个 时 钟 周期 ?(  ”)。 

A. 64 2 C. 80 D. 160 

31. 假定 采用 多 模块 交叉 存储 器 组 织 方式 ,存储 器 芯片 和 总 线 支持 突 发 传送 ,CPU 通 
过 存储 器 总 线 读 取 数 据 的 过 程 为 : 发 送 首 地 址 和 读 命 令 需 1 个 时 钟 周 期 ,存储 器 准备 第 一 
个 数据 需 8 个 时 钟 周期 ( 即 CAS 潜伏 期 =8) ,随后 每 个 时 钟 周期 总 线 上 传送 1 个 数据 ,可 连 
续 传 送 8 个 数据 ( 即 突 发 长 度 二 8)。 若 主 存 和 cache 之 间 交 换 的 主 存 块 大 小 为 64B, 存 取 宽 
度 和 总 线 宽度 都 为 8B, 则 cache 的 一 次 缺失 损失 至 少 为 多 少 个 时 钟 周期 ? ( ”)。 

A. 17 B. 20 38 D. 65 
32. 以 下 是 有 关 虚 拟 存储 管理 机 制 中 地 下 转换 的 叙述 ,其 中 错误 的 是 (  ”)。 
A. 地 址 转换 是 指 把 逻辑 地 址 转换 为 物理 地 址 
B. 一 般 来 说 ,逻辑 地 址 比 物理 地 址 的 位 数 少 
C. 地 址 转换 过 程 中 会 发 现 是 否 “ 缺 页 ” 
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D. MMU 在 地 址 转换 过 程 中 要 访问 页 表 项 

33. 下 列 命中 组 合 情 况 中 ,一 次 访 存 过 程 中 不 可 能 发 生 的 是 ( 及 
A， TLB 命中 cache 命中 、Page 命中 
B. TLB 未 命中 .cache 命中 、Page 命中 
C. TLB 未 命中 、cache 未 命中 、Page 命中 
D. TLB 未 命中 、cache 命中 、Page 未 命中 

34. 以 下 是 有 关 虚 拟 存储 管理 机 制 中 页 表 的 叙述 ,其 中 错误 的 是 ( Ys 
A. 系统 中 每 个 进程 有 一 个 页 表 
B, 页 表 中 每 个 表 项 与 一 个 虚拟 页 对 应 
C. 每 个 页 表 项 中 都 包含 装 人 位 (有 效 位 ) 
D. 所 有 进程 都 可 以 访问 页 表 

35. 以 下 是 有 关 “ 缺 页 ”处 理 的 叙述 ,其 中 错误 的 是 ( js 
A. 缺 页 处 理 过 程 中 需要 修改 TLB 
B. 缺 页 是 一 种 外 部 中 断 , 需 要 调用 操作 系统 提供 的 中 断 服务 程序 来 处 理 
C. 缺 页 处 理 过 程 中 需 根据 页 表 中 给 出 的 磁盘 地 址 去 读 磁盘 数据 
D. 缺 页 处 理 完 后 要 重新 执行 发 生 缺 页 的 指令 

36. 以 下 是 有 关 页 式 虚拟 存储 器 的 叙述 ,其 中 错误 的 是 ( Ys 
A, 进程 被 划分 成 等 长 的 虚拟 页 ,内存 被 划分 成 同样 大 小 的 页 框 
B. 采用 全 相 联 映射 ,每 个 虚拟 页 可 以 映射 到 任何 一 个 空闲 的 页 框 中 
C， 当 从 磁盘 装 人 的 信息 不 足 一 页 时 会 产生 页 内 碎片 
D. 相对 于 段 式 虚拟 存储 器 ,分 页 方式 更 利于 存储 保护 

37. 以 下 是 有 关 段 式 虚拟 存储 器 的 叙述 ,其 中 错误 的 是 ( Xe 
A. 段 是 逻辑 结构 上 相对 独立 的 程序 块 ,因此 段 是 可 变 长 的 
B， 按 程序 中 实际 的 段 来 分 配 主 存 , 被 分 配 后 的 主 存 块 是 可 变 长 的 
C. 每 个 段 表 项 必须 记录 对 应 段 在 主 存 的 起 始 位 置 和 段 的 长 度 
D. 分 段 方式 对 低级 语言 程序 员 和 编译 器 来 说 是 透明 的 

38. 以 下 是 有 关 快 表 的 叙述 ,其 中 错误 的 是 ( Dy 
A. 快 表 的 英文 缩写 是 TLB, 称 为 转换 后 援 缓冲 器 
B. 快 表 中 存放 的 是 当前 进程 的 常用 页 表 项 
C. 若 在 快 表 中 命中 , 则 在 Ll cache 中 一 定 命中 
D. 快 表 是 一 种 高 速 缓存 ,通常 集成 在 CPU 芯片 中 
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【参考 答案 】 

1. D 2.C 3. A 4. A 5.A 6. D 7. A 
8. B 9. 了 B 10. B 11. B 12. D 13. A 14.C 
15. D 16. B 17;.:B 18. B 19. B 20. D 21，C 
22.C 23. C 24. B 25. C 26. D 27. C 28. C 
29. D 30.C 31. A 32. B 33. D 34. D 35. B 
36. D 37. D 38. C 
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4.6 分 析 应 用 题 


1. 假定 某 计 算 机 的 主 存 地 址 空间 大 小 为 512MB, 按 字 节 编 址 。 若 每 次 读 写 操作 最 多 
可 以 存 取 32 位 , 则 存储 器 地 址 寄存 器 MAR 和 存储 器 数据 寄存 器 MDR 的 位 数 至 少 分 别 为 
多 少 ? 

【分 析 解 答 】 

主 存 地址 空间 大 小 为 512MB, 按 字 节 编 址 ,说 明 每 个 存储 单元 有 8 位 ,共有 512M 一 22 
个 存储 单元 。 因 而 ,地 址 位 数 至 少 应 有 29 位 , 故 存放 主 存 地 址 的 存储 器 地 址 寄存 器 MAR 
至 少 应 有 29 位 。 每 次 读 写 最 多 存 取 32 位 ,因此 ,用 来 作为 读 / 写 数据 缓冲 的 存储 器 数据 寄 
存 器 MDR 的 位 数 至 少 应 有 32 位 。 

2. 某 计算 机 主 存 地 址 16 位 ,每 个 存储 单元 有 8 位 , 即 按 字 节 编 址 。 如 果 用 1KX4 位 的 
RAM 芯片 构成 该 计算 机 的 最 大 主 存 空间 ,需要 多 少 芯片 ? 片 选 逻辑 的 输入 需要 多 少 位 
地 址 ? 

【分 析 解 答 】 

因为 主 存 地 址 为 16 位 ,所 以 主 存 地 址 空间 大 小 为 64K 个 存储 单元 ,每 个 存储 单元 占 8 
位 。 因 此 需要 的 芯片 数 为 (64K/IK) X (8/4) 一 64X2 一 128。 存 储 器 在 字 方 向 上 扩展 了 64 
信 , 因 而 片 选 逻辑 需要 6 位 地 址 。 每 个 芯片 有 1IK 王 1024 一 2 个 单元 ,因此 芯片 内 地 址 位 数 
为 10 位 , 剩 下 6 位 地 址 正好 用 于 片 选 逻 辑 。 

3. 构成 256KX8 位 的 存储 器 , 需 多 少 个 64KX1 位 的 DRAM 芯片 ? 存储 器 所 有 单元 
刷新 一 遍 需 要 多 少 次 刷新 操作 ? 若 采 用 异步 刷新 方式 ,每 个 单元 刷新 闻 隔 不 超过 2ms, 则 生 
成 的 刷新 信号 的 间隔 时 间 是 多 少 ? 若 采用 集中 刷新 方式 , 则 存储 器 刷新 一 遍 最 少 用 多 少 个 
读 写 周期 ? 若 改 用 16KX+4 位 的 DRAM 芯片 构成 上 述 256KX8 位 的 存储 器 , 则 存储 器 所 有 
单元 刷新 一 遍 需 要 多 少 次 刷新 操作 ? 

【分 析 解 答 】 

该 存储 器 所 需 芯 片 数 为 (256K/64K) X (8/1) = 32。 因 为 所 用 芯片 为 64KX1 位 的 
DRAM 芯片 ,因而 芯片 中 只 有 一 个 位 平面 ,256X256 的 存储 阵列 结构 构成 了 64K 个 单元 ， 
构成 存储 器 的 所 有 芯片 同时 按 行 刷新 ,每 个 芯片 有 256 行 , 所 以 存储 器 所 有 单元 刷新 一 遍 至 
少 需 要 256 次 刷新 操作 。 若 采用 异步 刷新 方式 , 则 相 邻 两 次 刷新 信号 产生 的 间隔 时 间 为 
2ms/256z7. 8ps。 若 采用 集中 刷新 方式 , 则 整个 存储 器 刷新 一 遍 最 少 用 256 个 读 写 周期 ， 
在 这 个 过 程 中 ,存储 器 不 能 进行 读 写 操作 。 

若 改 用 16KX4 位 的 DRAM 芯片 , 则 每 个 芯片 中 的 存储 阵列 由 4 个 128X128 的 位 平 
面 构成 , 则 4 个 存储 阵列 中 行 号 相同 的 那些 行 同时 进行 刷新 操作 ,共有 128 行 , 因 而 整个 存 
储 器 刷新 一 遍 只 需要 128 次 刷新 操作 。 

4.。 某 计算 机 的 主 存 地 址 空间 大 小 为 64KB, 按 字 节 编 址 ,已 配 有 0000H~7FFFH 的 
ROM 区 , 若 再 用 8KX4 位 的 RAM 芯片 形成 其 余 32K X8 位 的 RAM 存储 区 , 则 需要 多 少 
个 这 样 的 RAM 芯片 ? 假定 将 该 计算 机 的 主 存 地 址 空间 升级 为 16MB,ROM 区 地 址 范围 还 
是 000000H~007FFFH, 剩 下 的 所 有 地 址 空间 都 用 8KX4 位 的 RAM 芯片 配置 , 则 需要 多 
少 个 这 样 的 RAM 芯片 ? 
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【分 析 解 答 】 

因为 主 存 地 址 空间 为 64KB, 按 字 节 编 址 ,所 以 主 存 地 址 范围 为 0000OH~FFFFH, 其 中 
0000H~7FFFH 为 ROM 区 ,8000H~FFFFH 为 RAM 区 , 当 Ais 为 0 时 选中 ROM 芯片 ， 
当 Ais 为 1 时 选中 RAM 芯片 。 因 为 RAM 区 的 大 小 为 32KB, 故 需 8K X4 位 的 RAM 芯片 
数 为 32KB/(8KX 4b) 一 4X2 一 8。 若 主 存 地 址 空间 升级 为 16MB 时 , 主 存 地 址 为 24 位 ， 
ROM 区 范围 为 000000H~007FFFH ,其 大 小 为 32KB, 主 存 空 间 总 大 小 为 16MB=512 X 
32KB, 所 以 RAM 区 大 小 为 511X 32KB, 需 使 用 的 RAM 芯片 数 为 511X32KB/ (8KX4b)= 
511X4X2=4088。 

5. 假设 CPU 有 16 根 地 址 引 脚 ,8 根 数 据 引 脚 ,并 用 MREQ 作 为 访 存 控 制 信号 ( 低 电 平 
有 效 ) ,用 WR 作为 读 / 写 控 制 信号 ( 低 电 平 为 写 , 高 电 平 为 读 )。 现 有 以 下 规格 的 存储 器 芯 
片 : IKX4 位 RAM、4KX8 位 RAM、1KX8 位 ROM、4KX8 位 ROM, 男 外 有 74LS138 译 
码 器 和 各 种 门 电 路 。 主 存 地 址 空间 分 配 为 : 6000H~67FFH 为 ROM 区 ,6800H ~ 6BFFH 
为 RAM 区 ,其 余 为 备用 区 , 暂 不 连接 芯片 。 请 画 出 CPU 与 存储 器 的 连接 图 ,并 详细 画 出 片 
选 逻 辑 。 

【分 析 解 答 】 

第 一 步 ; 将 十 六 进 制 地 址 写成 对 应 的 二 进 制 地 址 形式 。 

A Au AnsAAuArw As As A Al As A, A A, Al Au 


o1f 0 000000000 0 kom 
| Kx8 位 

(oo ON |e | Ls Es i ss 
oo1flo010000000000 i 
ls | 1Kx8 位 

oie 1 es ee ke es She HE hl vi A i he 


第 二 步 : 选择 芯片 。ROM 区 选择 2 片 1KX8 位 ROM 芯片 ;RAM 区 选择 2 片 1KX4 
位 RAM 芯片 。 选 其 他 芯片 都 不 合理 。 

第 三 步 : 地 址 线 的 连接 。 对 于 1KX8 位 的 ROM 芯片 和 1KX4 位 的 RAM 芯片 来 说 ， 

芯片 内 的 地 址 位 数 都 为 10 位 ,因此 , 每 个 芯片 的 地 址 引 脚 都 分 别 与 地 址 线 
AAA;AiAiAi:AsA:AiA 相连 。 剩 下 的 高 位 地 址 线 和 访 存 控制 信号 MREQ 共 同 产生 片 选 
信号。 

第 四 步 : 片 选 信号 的 形成 。 按 本 题 要 求 , As Au 一 01, ROM 区 的 As As An 一 100， 
RAM 区 的 Ais A Au A 二 1010。74LS138 译 码 器 要 求 控制 端 Gi 为 高 ,Ga 与 Ga 为 低 , 因 
此 可 把 它们 分 别 接 到 Au、Ais 和 MREQ 上 。 地 址 线 Ais Al Ai 可 作为 译 码 器 的 C、.B、A 输入 
端 。 最 终 的 片 选 信号 由 译 码 器 输出 信号 和 地 址 线 Aie 组 合生 成 。 具 体 的 连接 如 图 4. 2 所 
示 ,其 中 CS 为 片 选 信号 。 

6. 假定 一 个 存储 器 系统 支持 四 体 交 叉 存 取 , 某 程序 执行 过 程 中 ,CPU 访问 的 主 存 地 址 
序列 为 3,9,17,2,51,37,13,4,8,41,67,10, 则 哪些 地 址 访问 会 发 生体 冲突 ? 

【分 析 解 答 】 

对 于 四 体 交叉 访问 的 存储 系统 ,理想 情况 下 ,每 隔 1/4 周期 可 读 写 一 个 数据 ,假定 这 个 
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图 4.2 题 5 中 CPU 与 存储 芯片 的 连接 


时 间 为 At。 每 个 存储 模块 内 的 地 址 分 布 如 下 。 


模块 0: 
模块 1: 
模块 2 
模块 3: 
很 显然 ， 
突 。 所 以 17 


0、4、8、12、16、… 

1、5、9、13、17、…、37、、 4 

2、6、10、14、18、… 

3、7、11、.15、19、、51、…、67、… 

如 果 相 邻 四 次 访问 中 给 定 的 访 存 地 址 出 现在 同一 个 模块 内 ,就 会 发 生 访 存 冲 
和 9、37 和 17、13 和 37、8 和 4 会 发 生 冲 突 。41 和 13 也 在 同一 个 模块 内 且 访 问 


间隔 小 于 4 个 Az, 但 是 ,由 于 访问 第 8 单元 发 生 冲 突 而 使 其 访问 延迟 3 个 Az 进行 ,从 而 使 得 
41 号 单元 也 延迟 3 个 At 访问, 因而 ,其 访问 不 会 和 13 号 单元 的 访问 发 生 冲 突 。 

7. 现代 计算 机 中 ,SRAM 一 般 用 于 实现 快速 小 容量 的 cache, 而 DRAM 用 于 实现 慢 速 
大 容量 的 主 存 。 以 前 超级 计算 机 通常 不 提供 cache, 而 是 用 SRAM 来 实现 主 存 ( 如 Cray 巨 


型 机 ) ,请 问 : 
【分 析 解 


如 果 不 考虑 成 本 ,你 还 这 样 设计 高 性 能 计算 机 吗 ? 为 什么 ? 
答 】 


不 会 。 其 理由 主要 有 以 下 两 个 方面 : 
(1) 主 存 越 大 越 好 , 主 存 大 , 缺 页 率 降低 ,因而 减少 了 访问 磁盘 所 需要 的 时 间 。DRAM 
芯片 的 集成 度 比 SRAM 芯片 的 高 得 多 ,因而 ,用 DRAM 芯片 比 用 SRAM 芯片 构成 的 主 存 


容量 大 得 多 。 


《2) 程序 访问 的 局 部 性 特点 使 得 cache 的 命中 率 很 高 ,因而 ,CPU 访问 的 主要 是 
cache, 对 主 存 的 访问 不 多 ,而 且 现 代 DRAM 芯片 中 也 有 SRAM 构成 的 高 速 缓存 区 。 因 此 


即使 主 存 没 有 使 用 快速 的 SRAM 芯片 而 是 用 DRAM 芯片 ,也 不 会 对 存储 访问 速度 有 多 


大 影响 。 


8. 某 计算 机 主 存 地 址 空间 大 小 有 8MB, 分 成 32768 个 主 存 块 , 按 字 节 编 址 ;cache 可 存 
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放 8KB 数据 (不 包括 有 效 位 标记 等 附加 信息 ), 采 用 直接 映射 方式 , 问 cache 共有 多 少 行 ? 
主 存 地 址 如 何 划 分 ? 要 求 说 明 每 个 字段 的 含义 、 位 数 和 在 主 存 地 址 中 的 位 置 。 

【分 析 解 答 】 

每 个 主 存 块 大 小 为 8MB/32768 二 256B, 故 cache 共有 8KB/256B= 二 32 行 。 直 接 映 射 方 
式 下 ,cache 行 号 (即行 索引 ) 有 5 位 ;由 于 每 个 主 存 块 大 小 为 256B, 按 字 节 编 址 , 故 块 内 地 址 
为 8 位 ;因为 主 存 地 址 空间 大 小 为 8MB, 所 以 主 存 地 址 位 数 为 23 位 , 故 主 存 地 址 中 标记 有 
23 一 5 一 8 二 10 位 。 综 上 所 述 , 主 存 地 址 共有 以 下 3 个 字段 : 高 10 位 为 标记 ,中 间 5 位 为 行 
索引 , 低 8 位 为 块 内 地 址 。 

9. 某 计 算 机 主 存 地 址 空间 大 小 为 1GB, 按 字 节 编 址 。cache 可 存放 64KB 数据 , 主 存 块 
大 小 为 128 字 节 ,采用 直接 映射 和 全 写 (Write Through) 方 式 。 请 回答 下 列 问题 : 

(1) 主 存 地 址 如 何 划分 ? 要 求 说 明 每 个 字段 的 含义 、 位 数 和 在 主 存 地 址 中 的 位 置 。 

(2) cache 的 总 容量 为 多 少 位 ? 

【分 析 解 答 】 

(1) cache 共有 64KB/128B 二 512 行 , 直 接 映 射 方式 下 ,cache 行 号 占 9 位 ;由 于 每 个 主 
存 块 大 小 为 128B, 按 字 节 编 址 , 故 块 内 地 址 为 7 位 ; 主 存 地 址 空间 大 小 为 1GB, 所 以 地 址 位 
数 为 30 位 。 主 存 地 址 中 标记 有 30 一 9 一 7=14 位 。 综 上 所 述 , 主 存 地 址 共有 以 下 3 个 字段 : 
高 14 位 为 标记 ,中 间 9 位 为 行 索引 , 低 7 位 为 块 内 地 址 。 

(2) 因为 直接 映射 不 考虑 替换 算法 ,所 以 cache 行 中 没有 用 于 替换 的 控制 位 ;因为 采用 
全 写 方式 ,所 以 ,cache 行 中 也 没有 修改 位 。 每 个 cache 行 中 包含 1 位 有 效 位 、14 位 标记 位 和 
128B 的 数据 ,因此 ,cache 总 容量 为 512X(1 十 14 十 128X8)b 王 519. 5Kb。 

10. 对 于 数据 的 访问 ,分 别 给 出 具有 下 列 要 求 的 程序 或 程序 段 的 示例 。 

(1) 空间 局 部 性 和 时 间 局 部 性 都 好 。 

(2) 时 间 局 部 性 好 ,空间 局 部 性 差 。 

(3) 空间 局 部 性 好 ,时 间 局 部 性 差 。 

(4) 时 间 局 部 性 和 空间 局 部 性 都 差 。 

【分 析 解 答 】 

对 于 按 行 优先 存放 在 内 存 的 多 维 数组 ,如 果 按 列 优先 访问 数组 元 素 , 则 空间 局 部 性 就 
差 ; 如 果 在 一 个 循环 体 中 某 个 数组 元 素 只 被 访问 一 次 , 则 时 间 局 部 性 就 差 。 假 定 二 维 数组 
aL1000]L1000] 按 行 优先 存放 在 内 存 , 以 下 给 出 的 4 个 程序 片段 用 于 对 数组 a 进行 相应 的 处 
理 , 它 们 具有 相同 的 功能 ,但 数组 访问 的 时 间 局 部 性 和 空间 局 部 性 截然 不 同 (不 考虑 编译 器 
的 优化 ) 。 

(1) 时 间 局 部 性 和 空间 局 部 性 都 好 


for (i=0; i<1000; i++) 
for (j=0; 3<1000; j++) { 
sum=sumt+al[i] [j]; 
product=product* al[il] [j]; 


square=squaretal[li][j]* al[i] [j]; 
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2) 时 间 局 部 性 好 ,空间 局 部 性 差 


for (j=0; j<1000; j++) 
for (i=0; i<1000; i++) { 


sum=sum+al[i] [j]; 


product=product* al[il] [j]; 
square=squaretal[i][j]* al[il] [j]; 
} 


(3) 空间 局 部 性 好 ,时 间 局 部 性 差 


for (i=0; i<1000; i++) 
for (j=0; j<1000; j++) 
sum=sum+al[i] [j]; 
for (i=0; i<1000; i++) 
for (j=0; j<1000; j++) 
product=product* a[i] [j]; 
for (i=0; i<1000; i++) 
for (j=0; 3<1000; j++) 


square=squaret+al[i] [j]* al[i] [j]; 
(4) 时 间 局 部 性 和 空间 局 部 性 都 差 


for (j=0; 3<1000; j++) 
for (i=0; i<1000; i++) { 
sum=sum+tal[i] [j]; 
for (j=0; j<1000; j++) 
for (i=0; i<1000; i++) { 
product=product* a[i] [j]; 
for (j=0; 3<1000; j++) 
for (i=0; i<1000; i++) { 


square=squaretal[li] [j]* al[i] [j]; 


11. 假定 某 计 算 机 的 主 存 地 址 空间 大 小 为 64KB, 按 字 节 编 址 ;cache 采用 4- 路 组 相 联 映 
射 LRU 替换 和 写 回 (Write Back) 策 略 , 能 存放 4KB 数据 , 主 存 与 cache 之 间 交 换 的 主 存 块 
的 大 小 为 64 字 节 。 请 回答 下 列 问题 : 

(1) 主 存 地 址 字段 如 何 划分 ?” 要 求 说 明 每 个 字段 的 含义 、 位 数 和 在 主 存 地 址 中 的 位 置 。 

(2) cache 的 总 容量 有 多 少 位 ? 

(3) 若 cache 初始 为 空 ,CPU 依次 从 0 号 地 址 单元 顺序 访问 到 4344 号 单元 , 共 重 复 访 
间 16 次 。cache 存 取 时 间 为 20ns, 主 存 存 取 时 间 为 200ns, 试 估计 CPU 访 存 的 平均 时 间 。 

【分 析 解 答 】 

(1) cache 的 行 数 为 4KB/64B 一 64; 因为 采用 4- 路 组 相 联 ,所 以 每 组 4 行 , 共 16 组 。 
主 存 地 址 空间 大 小 为 64KB, 故 主 存 地 址 有 16 位 ,其 中 低 6 位 为 块 内 地 址 ,中 间 4 位 为 组 号 
(组 索引 ) ,高 6 位 为 标记 。 

(2) 因为 采用 写 回 策略 ,所 以 cache 每 行 中 要 有 一 个 修改 位 (Dirty Bit); 因 为 每 组 有 4 
行 ,所 以 每 行 有 两 位 LRU 位 。 此 外 ,每 行 还 有 6 位 标记 、1 位 有 效 位 和 64 字 节 数据 ,共有 64 
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行 , 故 总 容量 为 64X(6 十 1 十 1 十 2 十 64X8) 二 33408 位 。 

(3) 块 大 小 为 64 字 节 ,CPU 总 共 访 问 了 4345 个 单元 ,4345/64 王 67. 89, 因 此 第 0 一 
4344 单元 应 该 对 应 前 68 块 (第 0 一 67 块 ), 即 CPU 访问 过 程 是 对 主 存 的 前 68 块 连续 访问 
16 次 。 图 4.3 给 出 了 访问 过 程 中 主 存 块 和 cache 行 之 间 的 映射 关系 。 图 中 列 方向 是 cache 
的 16 个 组 , 行 方向 是 每 组 的 4 行 。 


第 0 行 第 ! 行 第 2 行 第 3 行 
第 0 组 0/64/48 16/0/64 32/16 48/32 
第 1 组 1/65/49 17/1/65 33/17 49/33 
第 2 组 | 2/66/50 18/2/66 34/18 50/34 
第 3 组 3/67/51 19/3/67 35/19 51/35 
第 4 组 4 20 36 52 
第 15 组 | 15 31 47 63 


图 4.3 题 11 中 cache 组 和 主 存 块 之 间 的 映射 


主 存 的 第 0 一 15 块 分 别 对 应 cache 的 第 0 一 15 组 ,可 以 放 在 对 应 组 的 任意 一 行 中 ,在 此 
假定 按 顺 序 存放 在 对 应 组 的 第 0 行 ; 主 存 的 第 16~31 块 也 分 别 对 应 cache 的 第 0~15 组 ， 
假定 放 在 各 组 的 第 1 行 中 ; 同 理 , 主 存 的 第 32 一 47 块 分 别 放 在 cache 的 第 0 一 15 组 的 第 2 
行 中 ; 主 存 的 第 48~63 块 分 别 放 在 cache 的 第 0~15 组 的 第 3 行 中 。 这 样 ,访问 主 存 的 第 
0 一 63 块 都 没有 冲突 ,每 块 都 是 第 一 次 在 cache 中 没有 找到 ,然后 把 这 一 块 调 到 cache 对 应 
组 的 某 一 行 中 ,这 样 该 块 后 面 的 每 次 访问 都 能 在 cache 中 找到 。 因 此 ,每 一 块 只 有 第 一 单元 
未 命中 ,其 余 63 个 单元 都 命中 。 主 存 的 第 64 一 67 块 分 别 对 应 cache 的 第 0 一 3 组 ,此 时 ,这 
4 组 的 4 个 行 都 已 经 被 主 存 块 占 满 ,所 以 这 4 组 的 每 一 组 都 要 选择 一 个 主 存 块 从 cache 中 淘 
汰 出 来 。 因 为 采用 LRU 算法 ,所 以 ,将 最 近 最 少 用 的 第 0 一 3 块 分 别 从 第 0 一 3 组 的 第 0 行 
中 替换 出 来 。 再 把 第 64 一 67 块 分 别 放 到 cache 第 0 一 3 组 的 第 0 行 中 ,每 块 也 都 是 第 一 次 
在 cache 中 未 命中 , 调 入 后 ,每 次 都 能 在 cache 中 命中 。 

综 上 所 述 , 第 一 次 循环 中 ,每 一 块 都 只 有 第 一 单元 未 命中 ,其 余 都 命中 。 

以 后 的 15 次 循环 中 ,因为 cache 第 4~15 组 的 48 行 中 的 主 存 块 一 直 没 有 被 替换 过 ,所 
以 只 有 68 一 48 二 20 个 行 中 对 应 主 存 块 的 第 一 个 单元 未 命中 ,其 余 都 命中 。 

总 访问 次 数 为 4345X16 一 69520 ,其 中 ,未 命中 次 数 为 68 十 15X20 一 368。 

命中 率 p 为 (69520 一 368)/69520 一 99. 47%。 平 均 访 存 时 间 约 为 t==t. 十 (1 一 p) X 
ta 一 20ns 十 200X(1 一 0. 9947)ns 一 20ns 十 1. 06ns 一 21. 06ns。 

12. 假定 某 计 算 机 的 cache 采用 直接 映射 方式 ,和 主 存 交换 的 数据 块 大 小 为 1 个 字 , 按 
字 编 址 ,一 共 能 存放 16 个 字 的 数据 。CPU 开始 执行 某 程序 时 ,cache 为 空 ,在 该 程序 执行 过 
程 中 ,CPU 依次 访问 以 下 地 址 序列 : 2,3,11,16,21,13,64,48,19,11,3,22,4,27,6 和 11。 
请 回答 下 列 问题 : 

(1) 每 次 访问 在 cache 中 命中 还 是 缺失 ? 试 计 算 访 问 上 述 地 址 序列 的 cache 命中 率 。 

(2) 若 cache 数据 区 容量 还 是 16 个 字 ,而 数据 块 大 小 改 为 4 个 字 , 则 上 述 地 址 序列 的 命 
中 情况 又 如 何 ? 说 明 块 大 小 和 命中 率 的 关系 。 
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【分 析 解 答 】 

(1) cache 采用 直接 映射 ,每 行 存放 一 个 字 , 因 此 共 16 行 ;每 个 主 存 块 对 应 1 个 字 , 所 以 
主 存 块 号 一 字号 。 得 到 映射 公式 为 cache 行 号 一 字号 mod 16。 程 序 开始 执行 时 cache 为 
空 , 所 以 每 个 单元 第 一 次 访问 总 是 缺失 (Miss) 。CPU 访问 给 定 地 址 序列 的 过 程 如 下 。 (每 
个 数字 对 “zx-y” 的 食 义 为 “zx 是 访问 的 主 存 地 址 ,> 是 对 应 的 cache 行 号 ”; Hit 表示 命中 ， 
Miss 表示 缺失 ,Miss/Replace 表示 缺失 并 替换 ) 

2-2:Miss; 3-3: Miss; 11-11: Miss; 16-0: Miss; 21-5: Miss; 13-13: Miss; 64-0: Miss/ 
Replace; 48-0: Miss/Replace; 19-3: Miss/Replace; 11-11: Hit; 3-3: Miss/Replace; 22-6 : 
Miss; 4-4:Miss; 27-11: Miss/Replace; 6-6: Miss/Replace; 11-11: Miss/Replace。 只 有 一 
次 命中 。 命 中 率 为 1/16==6.25%。 

(2) 数据 块 大 小 改 为 4 个 字 ,cache 能 存放 16 个 字 的 数据 , 故 cache 共 4 行 ;每 个 主 存 块 
有 + 个 字 , 即 主 存 块 号 =[ 字 号 /4] ,映射 公式 为 cache 行 号 = 主 存 块 号 mod 4。CPU 访问 给 
定 地 址 序列 的 过 程 如 下 。 每 个 数字 对 “yz? 的 含义 为 “z 是 访问 的 主 存 地 址 ,y 是 对 应 的 
主 存 块 号 ,< 是 对 应 的 cache 行 号 ”; Hit 表示 命中 ,Miss 表示 缺失 ,Miss/Replace 表示 缺失 
并 替换 ) 

2-0-0:Miss; 3-0-0: Hit; 11-2-2: Miss; 16-4-0: Miss/Replace; 21-5-1: Miss; 13-3-3: 
Miss; 64-16-0: Miss/Replace; 48-12-0: Miss/Replace; 19-4-0: Miss/Replace; 11-2-2: Hit; 
3-0-0;Miss/Replace; 22-5-1: Hit; 4-1-1: Miss/Replace; 27-6-2: Miss/Replace; 6-1-1: Hit; 
11-2-2:Miss/Replace。 共 命中 4 次 ,命中 率 为 4/16 王 25% 。 数 据 块 变 大 后 ,命中 率 提 高 了 ， 
其 原因 在 于 块 变 大 后 空间 局 部 性 优势 得 到 更 大 发 挥 。 

13. 假定 数组 元 素 在 主 存 按 从 左 到 右 的 下 标 顺序 存放 。 试 改变 下 列 函 数 中 循环 的 顺 
序 , 使 得 其 数组 元 素 的 访问 与 排列 顺序 一 致 ,并 说 明 为 什么 修改 后 的 程序 比 原来 的 程序 执行 
时 间 短 。 

int sum array (int a[N] [N] [N]) 

{ 


int i, j, k, sum=0; 
for (i=0; i<N; i++) 
for (j=0; j<N; j++) 
for (k=0; k<N; k++) 
sum+=a[k] [i] [j]; 
return sum; 
} 


【分 析 解 答 】 
数组 元 素 的 访问 顺序 和 排列 顺序 一 致 的 程序 如 下 : 


int sum array (int a[N] [N] [N]) 
站 
int i, j, k, sum=0; 
for (k=0; k<N; k++) 
for (i=0; i<N; i++) 
for (j=0; j<N; j++) 
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sumt=a[k] [i] [j]; 


i 
return sum; i 


} 


当 被 访问 的 数组 元 素 不 在 cache 中 时 , 则 将 该 数组 元 素 所 在 的 一 个 主 存 块 全 部 装 人 
cache, 因 为 访问 顺序 和 排列 顺序 一 致 ,所 以 ,随后 访问 的 若干 个 数组 元 素 都 和 该 数组 元 素 在 
同一 个 主 存 块 中 ,因而 也 都 能 在 cache 中 命中 。 因 此 ,修改 后 的 程序 ,其 数组 访问 的 空间 局 
部 性 比 原 程序 更 好 ,命中 率 更 高 ,使 得 执行 时 间 更 短 。 

14. 某 计 算 机 的 主 存 地 址 空间 大 小 为 256 MB, 按 字 节 编 址 。 指 令 cache 和 数据 cache 


分 离 , 均 有 8 个 cache 行 , 主 存 与 cache 交换 的 块 大 小 为 64 B, 数 据 cache 采用 直接 映射 方 
式 。 现 有 两 个 功能 相同 的 程序 A 和 B, 其 伪 代 码 如 图 4.4 所 示 。 
程序 A: 程序 B， 
int a[256] [256]; int a[256] [256]; 
int sum arrayl () int sum array2 () 
{ { 
int i, j, sum=0; int i, j, sum=0; 
for (i=0; i<256; i++) for (j=0; j<256; j++) 
for (j=0; j<256; j++) for (i=0; i<256; i++) 
sum+=a[i] [j]; sumt=al[il [j]; 
return sum; return sum; 
} } 


图 4.4 题 14 的 伪 代 码 程序 


假定 int 类 型 数据 用 32 位 补 码 表示 ,程序 编译 时 i,j,sum 均 分 配 在 寄存 器 中 ,数组 a 按 
行 优先 方式 存放 ,其 首 地 址 为 320( 十 进 制 数 )。 请 回答 下 列 问题 ,要 求 说 明理 由 或 给 出 计算 
过 程 。 

(1) 若 不 考虑 用 于 cache 一 致 性 维护 和 替换 算法 的 控制 位 , 则 数据 cache 的 总 容量 为 
多 少 ? 

《2) 数组 元 素 aeL0][L31] 和 a[1][1] 各 自 所 在 的 主 存 块 对 应 的 cache 行 号 分 别 是 多 少 
(cache 行 导 从 0 开始 )? 

(3) 程序 A 和 B 的 数据 访问 命中 率 各 是 多 少 ? 哪个 程序 的 执行 时 间 更 短 ? 

【分 析 解 答 】 

(1) cache 中 的 每 一 行 信息 除了 用 于 存放 主 存 块 的 数据 区 外 ,还 有 有 效 位 \、 标 记 信 息 , 以 
及 用 于 cache 一 致 性 维护 的 修改 位 (Dirty Bit) 和 用 于 替换 算法 的 使 用 位 (如 LRU 位 ) 等 控 
制 位 。 因 为 主 存 地 址 空间 大 小 为 256MB, 因 而 主 存 地 址 为 28 位 ,其 中 6 位 为 块 内 地 址 ,3 位 
为 行 号 ( 行 索引 ) ,标志 信息 有 28 一 6 一 3 二 19 位 。 因 此 ,在 不 考虑 用 于 cache 一 致 性 维护 和 
替换 算法 的 控制 位 的 情况 下 ,数据 cache 的 总 容量 为 8X(19 十 1 十 64X8) 二 4256 位 = 二 532 字 
节 。 

(2) 解法 一 : 要 得 到 某 个 数组 元 素 所 在 块 对 应 的 cache 行 号 ,最 简单 的 做 法 就 是 把 该 数 
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组 元 素 的 地 址 计算 出 来 ,然后 根据 地 址 求 出 主 存 块 号 ,最 后 用 主 存 块 号 除 以 8 取 余数 ( 即 主 
存 块 号 mod 8) ,所 得 结果 就 是 对 应 的 cache 行 号 。 因 为 每 个 数组 元 素 为 一 个 32 位 int 型 变 
量 , 故 占 4 个 字 节 。a[0][31] 的 地 址 为 320 十 4X31 一 444,[444/64] 一 6, 因 此 a[0][31] 对 应 
的 主 存 块 号 为 6。 因 为 “6 mod 8 一 6”, 所 以 对 应 的 cache 行 号 为 6。 

解法 二 : 也 可 以 将 地 址 转换 为 28 位 二 进 制 地 址 ,然后 取出 其 中 的 行 索引 ( 行 号 ) 字 段 ， 
得 到 对 应 行 号 。 首 先 将 地 址 444 转换 为 二 进 制 表示 为 0000 0000 0000 0000 000 110 
111100, 中 间 3 位 110 为 行 索引 ,因此 ,对 应 的 cache 行 号 为 6。 

解法 三 : 用 画图 的 方式 可 以 清楚 地 表示 cache 行 和 主 存 块 之 间 的 映射 关系 。( 略 ) 

同 理 , 数 组 元 素 aL1J[1] 所 在 主 存 块 对 应 的 cache 行 号 为 [(320 十 4X(C1X256 十 1) )/64] 
mod 8 一 5。 

(3) 编译 时 i,j,sum 均 分 配 在 寄存 器 中 , 故 数据 访问 命中 率 仅 需要 考虑 数组 a 的 访问 
情况 。 

@ 程序 A 的 数据 访问 命中 率 。 

解法 一 : 由 于 程序 A 中 数组 访问 顺序 与 存放 顺序 相同 , 故 依次 访问 的 数组 元 素 位 于 相 
邻 单元 ;该 程序 共 访 问 256X256 一 64K 次 数组 元 素 , 占 64KX4B/64B 一 4K 个 主 存 块 ;因为 
首 地 址 正好 位 于 一 个 主 存 块 的 边界 , 故 每 次 将 一 个 主 存 块 装 人 cache 时 ,总 是 第 一 个 数组 元 
素 缺 失 , 其 他 都 命中 , 共 缺 失 4K 次 ,因此 ,数据 访问 的 命中 率 为 〈64K 一 4K) /64K 一 
93.75%。 

解法 二 : 因为 每 个 主 存 块 的 命中 情况 都 一 样 ,因此 ,也 可 以 按 每 个 主 存 块 的 命中 率 计 
算 。 主 存 块 大 小 为 64B, 包 含 16 个 数组 元 素 , 因 此 , 共 访 存 16 次 ,其 中 第 一 次 不 命中 ,所 以 
命中 率 为 15/16 二 93.75%。 

@ 程序 B 的 数据 访问 命中 率 。 

由 于 程序 B 中 的 数组 访问 顺序 与 存放 顺序 不 同 , 依 次 访问 的 数组 元 素 分 布 在 相隔 
256X4 一 1024 的 单元 处 ,因此 ,依次 访问 的 前 后 数组 元 素 都 不 在 同一 个 主 存 块 中 ;因为 数据 
cache 只 有 8 行 , 而 每 次 内 循环 要 调 人 256X4B/64B=16 个 主 存 块 ,因此 ,以 前 被 装 人 cache 
的 主 存 块 , 当 需 要 再 次 访问 其 中 的 数组 元 素 时 ,已 经 被 替换 出 cache, 因而 不 能 命中 。 由 此 可 
知 , 所 有 访问 都 不 命中 ,命中 率 为 0。 

因为 程序 A 的 命中 率 高 ,因此 ,程序 A 的 执行 速度 比 程序 B 快 。 

15. 图 4.5 给 出 了 3 个 函数 ,分 析 比 较 它 们 的 空间 局 部 性 ,并 指出 哪个 最 好 ,哪个 最 差 ? 

【分 析 解 答 】 

对 于 函数 clearl ,其 数组 访问 顺序 与 在 内 存 的 存放 顺序 完全 一 致 ,因此 ,空间 局 部 性 
最 好 。 

对 于 函数 clear2 ,其 数组 访问 顺序 在 每 个 数组 元 素 内 跳跃 式 访问 , 相 邻 两 次 访问 的 单元 
最 大 相差 3 个 int 型 变量 (假定 sizeof (int) 一 4, 则 相当 于 12B), 因 此 空间 局 部 性 比 clearl 
差 。 若 主 存 块 大 小 比 12B 小 , 则 大 大 影响 命中 率 。 

对 于 函数 clear3 ,其 数组 访问 顺序 与 在 内 存 的 存放 顺序 不 一 致 , 相 邻 两 次 访问 的 单元 都 
相差 6 个 int 型 变量 (假定 sizeof(int) = 二 4, 则 相当 于 24B) 因 此 ,空间 局 部 性 比 clear2 还 差 。 
车主 存 块 大 小 比 24B 小 , 则 大 大 影响 命中 率 。 
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#define N 1000 #define N 1000 t Gefine N 1000 
typedef struct { typedef struct { typedef struct { 
int vel[3]7 int vel[l3]; int vel[3]; 
int acc[3]; int acc[3]; int acc[3]; 
} point; } point; } point; 
point p[N]; point p[N]; point p[N]; 


void clearl (point * p, int n)| void clear2 (point * p, int n)|void clear3(point * p, int n) 


{ { { 


让 int iv j; Enis 
for (i=0; i<n; i++) { for (i=0; i<n; i++) { for (j=0; j<3; j++) { 
for (j-0; j<3; j++) for (j=0; j<3; j++) { for (i=0; i<n; i++) 
P[i] .vel[j]=0; p[i] .vel[lj]=0; plil].vellj]=0; 
for (j=0; j<3; j++) pli] .acc[j]=0; for (i=0; i<n; i++) 
Pl[i] .acc[j]=0; } p[il.acc[j]=0; 


图 4.5 题 15 的 伪 代 码 程序 


16. 以 下 是 计算 两 个 向 量 点 积 的 程序 段 : 


float dotproduct (float x[8], float y[8]) 
{ 

float sum=0.0;» 

i 

for (i=0; i<8; i++) 

sumt+=x[i] * yl[lil; 

return sum; 

} 


请 回答 下 列 问 题 。 

(1) 访问 数组 zx 和 y 时 的 时 间 局 部 性 和 空间 局 部 性 各 如 何 ? 你 能 否 推断 出 命中 率 的 
高 低 ? 

〈2) 假定 数据 cache 采用 直接 映射 方式 ,数据 区 容量 为 32 字 节 ,每 个 主 存 块 大 小 为 16 
字 节 ;编译 器 将 变量 sum 和 i 分 配 在 寄存 器 中 ,数组 z 存放 在 0000 0040H 开始 的 32 字 节 
的 连续 存储 区 中 ,数组 y 则 紧 跟 在 zx 后 进行 存放 。 该 程序 数据 访问 的 命中 率 是 多 少 ? 要 求 
说 明 每 次 访问 时 cache 的 命中 情况 。 

(3) 将 上 述 (2) 中 的 数据 cache 改 用 2- 路 组 相 联 映射 方式 , 块 大 小 改 为 8 字 节 ,其 他 条 件 
不 变 , 则 该 程序 数据 访问 的 命中 率 是 多 少 ? 

(4) 在 上 述 (2) 中 条 件 不 变 的 情况 下 ,将 数组 z 定义 为 float[L12], 则 数据 访问 的 命中 率 
是 多 少 ? 

【分 析 解 答 】 

(1) 数组 x 和 y 都 按 存放 顺序 访问 ,空间 局 部 性 都 较 好 ,但 每 个 数组 元 素 都 只 被 访问 一 
次 , 故 没 有 时 间 局 部 性 。 命 中 率 的 高 低 与 块 大 小 、 映 射 方式 等 都 有 关 , 所 以 ,无 法 推断 命中 率 
的 高 低 。 
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(2) cache 共有 32B/16B 一 2 行 ;4 个 数组 元 素 占 一 个 主 存 块 ;数组 z 的 8 个 元 素 ( 共 
32B) 分 别 存放 在 主 存 40H 开始 的 32 个 单元 中 , 共 占 有 2 个 主 存 块 , 其 中 z[0] 一 z[3] 在 第 4 
块 ,z[4] 一 z[7] 在 第 5 块 中 ;数组 y 的 8 个 元 素 分 别 在 主 存 第 6 块 和 第 7 块 中 。 所 以 ， 
Zz[0]~z[3] 和 y[0] 一 >[3] 都 映射 到 cache 第 0 行 :z[4] 一 z[7] 和 y[4] 一 >[7] 都 映射 到 
cache 第 1 行 。 因 为 z[ 让 和 y[ 让 (0 二 <7) 总 是 映射 到 同一 个 cache 行 ,相互 淘汰 对 方 , 故 每 
次 都 不 命中 ,命中 率 为 0。 

(3) 车 cache 改 用 2- 路 组 相 联 , 块 大 小 改 为 8B, 则 cache 共有 4 行 ,每 组 两 行 , 共 两 组 。 
两 个 数组 元 素 占 一 个 主 存 块 。 数 组 z 占 4 个 主 存 块 , 数 组 元 素 zxL0] 一 z[1]、z[2] 一 z[3]、 
Z[4]~z[5]、z[6] 一 z[7] 分 别 在 第 8 一 11 块 中 ;数组 y 占 4 个 主 存 块 ,数组 元 素 >[0] 一 
y[1]、y[L2]~~yL3j、yL4j~~y[5]、yL6]~~yL7] 分 别 在 第 12 一 15 块 中 ;因为 每 组 有 两 行 , 所 以 
ZX[ 宁 和 y[ 宁 (0 志和 7) 虽 然 映 射 到 同一 个 cache 组 ,但 可 以 存放 到 同一 组 的 不 同 cache 行内 ， 
因此 ,不 会 发 生 冲突 。 每 调 人 一 个 主 存 块 , 装 和 人 的 2 个 数组 元 素 中 ,第 2 个 数组 元 素 总 是 命 
中 , 故 命中 率 为 50%。 

《4) 将 数组 工 定义 为 12 个 元 素 后 , 则 z 共有 48B, 使 得 y 从 主 存 第 7 块 开始 存放 , 即 
zx[0]~zx[3j 在 第 4 块 ,xz[4]~~x[7] 在 第 5 块 ,xz[8]~zx[11]j 在 第 6 块 中 ,y[0]~y[3j 在 第 7 
块 ,y[4]~y[7j 在 第 8 块 。 因 而 ,x[ 让 和 y[ 让 (0<i<<7) 就 不 会 映射 到 同一 个 cache 行 中 。 每 
调 人 一 个 主 存 块 , 装 入 4 个 数组 元 素 , 第 一 个 元 素 不 命中 ,后 面 3 个 总 命中 , 故 命 中 率 为 75%。 

17. 以 下 是 对 矩阵 进行 转 置 的 程序 : 


typedef int array[4] [4]; 
void transpose (array dst, array src) 
{ 

int i, j» 

for (i=0; i<4; i++) 

for (j=0; j<4; j++) 
dst [j] [i]=src[i] [j]; 

} 


假设 该 程序 运行 的 计算 机 中 sizeof(int)= 二 4, 且 只 有 一 级 cache, 其 中 L1 data cache 的 数 
据 区 大 小 为 32B ,采用 直接 映射 、 回 写 方式 , 块 大 小 为 16B, 初 始 为 空 。 数 组 dsz 从 地 址 0000 
C000H 开始 存放 ,数组 src 从 地 址 0000 C040HH 开始 存放 。 仿 照 col 二 0,row==0 栏目 中 的 形 
式 填写 表 4. 1, 说 明 数 组 元 素 srcLrowj][Lcol] 和 dstLrowjLcolj 各 自 映射 到 cache 哪 一 行 ,其 
访问 是 命中 (Hit) 还 是 缺失 (Miss)。 若 Ll data cache 的 数据 区 容量 改 为 128B 时 ,重新 填写 
表 中 内 容 。 


表 4.1 题 17 的 src 数 组 和 dst 数组 


co 一 0 


dst 数组 


0/Miss 
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【分 析 解 答 】 

从 程序 来 看 ,数组 访问 过 程 如 下 : 
src[0] [0]、dstL0] [0]、scLo] Dasx[Ll] [OJ\srcL0] [2、astL2] [0]、swcL0] [3]\dstL3] [0] 
scL1] [0]、dstLo] [scL1] Das] Cl]\sreL1] [2] dstL2] [1 、wcL1] [3]、LstL3] [1] 
src[2] [0]、dstL0] [2]、srcL2] [1 ZL] [2、srcL2] [2]\dstd 2] [2]、swcL2] [3]\dstL3] [2] 
src[3] [0]、dstL0] [3]、sc[3] [1 astL1] [3]、srcL3] [2]、dszL2] [3]、swc[3] [3]、dstL3] [3] 

因为 块 大 小 为 16B, 每 个 数组 元 素 有 4 个 字 节 ,所 以 4 个 数组 元 素 占 一 个 主 存 块 ,因此 

每 次 总 是 调和 人 4 个 数组 元 素 到 cache 的 一 行 中 。 

当 数 据 区 容量 为 32B 时 ,L1 data cache 中 共有 2 行 。 因 为 地 址 0000 C000H 和 0000 
C040H 的 最 低 5 位 都 是 0, 所 以 数组 元 素 dst[0][ 训 、dst[2][i、src[0][ 训 、src[2][ 可 (一 
0 一 3) 都 映射 到 cache 第 0 行 , 数 组 元 素 dsz[1][ 引 dsz[3][ 让 、src[L1j[ 让 、srcL3j[i (i 二 0~ 
3) 都 映射 到 cache 第 1 行 。 因 此 ,从 上 述 访问 过 程 来 看 ,srcL[0]j[0] 所 在 的 主 存 块 ( 即 存放 
sc[L0][ (一 0 一 3) 中 4 个 数组 元 素 的 主 存 块 ) 刚 调 人 cache,dst[0][0] 所 在 主 存 块 又 把 它 
替换 掉 了 。 

当 数 据 区 容量 为 128B 时 ,L1 data cache 中 共有 8 行 。 数 组 元 素 dsz[0j[i]、dst[1][ 引 、 
dst[2][i]、dstL3j[ 订 、srcL0jJ[i]、src[L1j[ 纪 ]、src[2j[i]、srcL[3j[ 让 (i 二 0~3) 分 别 映射 到 
cache 第 0、1.2、3、4、5、6、7 行 。 因 此 ,不 会 发 生 数 组 元 素 的 蔡 换 。 每 次 总 是 第 一 个 数组 元 素 
不 命中 ,后 面 3 个 数组 元 素 都 命中 。 

表 4.2 给 出 了 cache 数据 容量 分 别 为 32B 和 128B 时 数组 src 和 dsz 的 每 个 元 素 的 命中 
情况 。 


表 4.2 题 17 的 src 数 组 和 dst 数组 的 命中 情况 


src 数组 dst 数组 
32B col=3 col=0 co 一 1 co 一 2 col=3 
row=0 0/Miss 0/Miss 0/Miss 0/Miss 0/Miss 
row=1 1/Hit 1/Miss 1/Miss 1/Miss 1/Miss 
row=2 0/Miss 0/Miss 0/Miss 0/Miss 0/Miss 
row=3 1/Hit 1/Miss 1/Miss 1/Miss 1/Miss 
dst 数组 
128B col=0 col=1 co 一 2 co 一 3 
row=0 4/Miss 4/Hit 0/Miss O/Hit 0/Hit O/Hit 
row=1 5/Miss 1/Miss 1/Hit 1/Hit 1/Hit 
row=2 6/Miss 2/Miss 2/Hit 2/Hit 2/Hit 
70w 一 3 7/Miss 3/Miss 3/Hit 3/Hit 3/Hit 


18. 通过 对 方 格 中 每 个 点 设置 相应 的 CMYK 值 就 可 以 将 方 格 涂 上 相应 的 颜色 。 图 4. 6 
所 示 的 3 个 程序 都 可 实现 对 一 个 8X8 的 方 格 涂 上 黄 颜 色 的 功能 。 
假设 cache 的 数据 区 大 小 为 512B, 采 用 直接 映射 , 块 大 小 为 32B, 存 储 器 按 字 节 编 址 。 
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struct pt color { struct pt_color { struct pt_color { 
int cy; int cs int c; 
int my int m; int my; 
int y; int y; int y; 
int k; int k; int k; 


} 


struct pt color square[8] [8];| struct pt color auare[8] [8] ;| struct pt_color square[8] [8]; 


int i, 了? int i, j; int i, j; 
for (i=0; i<8; i++) { for (i=0; i<8; i++) { for (i=0; i<8; i++) 
for (j=0; j<8; j++) { for (j=0; j<8; j++) { for (j=0; j<8; j++) 
square [i] [j] .c=0; square [j] [i].c=0; square[i][j] .y=1; 
square[i] [j] .m=0; sauare [j] [i].m=0; |for (i=0; i<8; i++) 
square [i] [j] .y=1; sauare [j] [i].y=1; for (j=0; j< 8; j++) { 
square [i] [j] .k=0; sauare [j] [i].k=0; square[i][j].c=0; 
} } square[i][j] .m=0; 


} } square[i][j] .k=0; 


(a) 程序 段 A (b) 程序 段 B (c) 程序 段 C 
图 4.6 题 18 的 伪 代 码 程序 


编译 时 变量 i 和 j 分 配 在 寄存 器 中 ,sizeof(int) 二 4, 数 组 sguare 按 行 优先 方式 存放 在 0000 
0C80H 开始 的 连续 区 域 中 , 主 存 地 址 为 32 位 。 要 求 : 

(1) 对 3 个 程序 段 A、B、C 中 数组 访问 的 时 间 局 部 性 和 空间 局 部 性 进行 分 析 比 较 。 

(2) 画 出 主 存 中 的 数组 元 素 和 cache 行 的 对 应 关系 图 。 

(3) 计算 3 个 程序 段 A、B、C 中 数组 访问 的 写 操作 次 数 、 写 不 命中 次 数 和 写 缺 失 率 。 

【分 析 解 答 】 

(1) 程序 段 A、B 和 C 中 ,每 个 数组 元 素 都 是 只 被 访问 一 次 ,所 以 都 没有 时 间 局 部 性 ; 程 
序 段 A 访问 顺序 和 存放 顺序 一 致 ,所 以 ,空间 局 部 性 好 ;程序 段 B 访问 顺序 和 存放 顺序 不 一 
致 ,所 以 ,空间 局 部 性 不 好 ;程序 段 C 的 访问 顺序 和 存放 顺序 部 分 一 致 ,所 以 空间 局 部 性 的 
优 劣 介 于 程序 A 和 了 B 之 间 。 

(2) cache 行 数 为 512B/32B 一 16; 数 组 首 址 为 0C80H 一 0000 1100 1000 0000B, 正 好 是 
主 存 第 1100100B(100) 块 的 起 始 地址 ,所 以 数组 从 主 存 第 100 块 开 始 存放 。 一 个 数组 元 素 
占用 的 空间 大 小 为 4X4B 王 16B, 每 2 个 数组 元 素 占 用 一 个 主 存 块 ,8X 8 的 数组 共 占 用 32 
个 主 存 块 ,正好 是 cache 数据 区 大 小 的 2 倍 。 

因为 100 mod 16 王 4, 所 以 主 存 第 100 块 映 射 到 的 cache 行 号 为 4。 

主 存 中 数组 元 素 与 cache 行 的 映射 关系 如 图 4.7 所 示 。 

(3) 对 于 程序 段 A: 每 两 个 数组 元 素 ( 共 涉及 8 次 写 操作 ) 装 人 一 个 cache 行 中 ,总 是 第 
一 次 访问 时 未 命中 ,后面 7 次 都 命中 ,所 以 ,总 的 写 操作 次 数 为 64X4 王 256 次 , 写 不 命中 次 
数 为 256X1/8=32 次 ,因而 写 缺 失 率 为 12. 5% 。 对 于 程序 段 B: 每 两 个 数组 元 素 ( 共 涉及 8 
次 写 操作 ) 装 人 一 个 cache 行 中 ,但 总 是 只 有 一 个 数组 元 素 ( 涉 及 4 次 写 操作 ) 在 被 淘汰 之 前 
被 访问 ,并 且 总 是 第 一 次 不 命中 ,后 面 3 次 命中 。 即 写 不 命中 次 数 为 256X1/4 二 64 次 ,因而 
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图 4.7 主 存 中 数组 元 素 与 cache 行 的 映射 关系 


写 缺 失 率 为 25 % 。 对 于 程序 段 C: 第 一 个 循环 共 访 问 64 次 ,每 次 装 入 两 个 数组 元 素 ,第 一 
次 不 命中 ,第 二 次 命中 ;第 二 个 循环 , 共 访 问 64X3 次 ,每 两 个 数组 元 素 ( 共 涉及 6 次 写 操作 ) 
装 人 一 个 cache 行 中 ,并 且 总 是 第 一 次 不 命中 ,后 面 5 次 命中 。 所 以 总 的 写 不 命中 次 数 为 
32 十 (3X64)X1/6 一 64 次 ,因而 总 的 写 缺 失 率 为 25% 。 

19. 已 知 cachel 采用 直接 映射 方式 , 共 16 行 , 块 大 小 为 1 个 字 , 缺 失 损失 为 8 个 时 钟 周 
期 ;cache2 也 采用 直接 映射 方式 , 共 4 行 , 块 大 小 为 4 个 字 , 缺 失 损失 为 11 个 时 钟 周期 。 假 
定 开始 时 cache 为 空 ,采用 字 编 址 方式 。 要 求 找 出 一 个 访问 地 址 序列 ,使 得 cache2 具有 更 低 
的 缺失 率 , 但 总 的 缺失 损失 反而 比 cachel 大 。 

【分 析 解 答 】 

假设 cachel 和 cache2 的 缺失 次 数 分 别 为 x 和 yy, 根据 题 意 ,z 和 yy 必须 满足 以 下 条 件 : 
11y>>8z 且 z>y, 显 然 ,满足 该 条 件 的 zx 和 >y 有 许多 ,例如 ,x 二 4,y 二 3 或 z= 二 5,y 二 4 等 等 。 

对 于 以 下 的 访问 地 址 序列 : 0,1,4,8,cachel 缺失 4 次 ,而 cache2 缺失 3 次 ; 

对 于 以 下 的 访问 地 址 序列 : 0,2,4,8,12,cachel 缺失 5 次 ,而 cache2 缺失 4 次 ; 

对 于 以 下 的 访问 地 址 序列 : 0,3,4,8,12,16,20,cachel 缺失 7 次 ,而 cache2 缺失 6 次 ; 

如 此 等 等 ,可 以 找 出 很 多 。 

20. 提高 关联 度 通 常会 降低 缺失 率 ,但 并 不 总 是 这 样 。 请 给 出 一 个 地 址 访问 序列 ,使 得 
采用 LRU 替换 算法 的 2- 路 组 相 联 映射 cache 比 具 有 同样 大 小 的 直接 映射 cache 的 缺失 率 
更 高 。 

【分 析 解 答 】 

2- 路 组 相 联 cache 的 组 数 是 直接 映射 cache 的 行 数 的 一 半 , 所 以 ,可 以 找到 一 个 地 址 序 
列 A、B.C, 使 得 A 映射 到 某 一 个 cache 行 ,B 和 C 同时 映射 到 另 一 个 cache 行 ,并 且 A、B、C 
映射 到 同一 个 cache 组 。 这样 ,如 果 访 存 的 地 址 序列 为 A、.B、C、A、B、C、A、B、C、…, 则 对 于 
直接 映射 cache, 其 命中 情况 为 Miss/IMiss/IMiss/ Hit/Miss/Miss/ Hit/Miss/Miss/… 命 中 率 
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可 达 33.3% ;对 于 组 相 联 cache, 因 为 A、B、C 映射 到 同一 个 组 ,每 组 只 有 2 行 ,采用 LRU 替 
换算 法 ,所 以 ,每 个 地 址 处 的 数据 刚 调 出 cache 就 又 被 访问 到 ,每 次 都 是 Miss, 命中 率 为 0。 
例如 : 假定 直接 映射 cache 为 4 行 X1 字 / 行 ,同样 大 小 的 2- 路 组 相 联 cache 为 2 组 X2 行 / 
组 X1 字 / 行 , 当 访 问 序列 为 0、2、4、0、2、4、0、2、4、…( 局 部 块 大 小 为 3) 时 , 则 出 现 上 述 情况 。 

当 访问 的 局 部 块 比 组 大 时 ,可 能 会 发 生 “* 颠 篮 ( 抖 动 )? 现 象 : 刚 被 蔡 换 出 去 的 数据 又 被 
访问 ,导致 缺失 率 为 100%! 

21. 假定 有 3 个 处 理 器 ,分 别 带 有 以 下 不 同 的 cache: 

cachel : 采用 直接 映射 方式 , 块 大 小 为 1 个 字 , 指 令 和 数据 的 缺失 率 分 别 为 4% 和 6%， 

cache2: 采用 直接 映射 方式 , 块 大 小 为 4 个 字 , 指 令 和 数据 的 缺失 率 分 别 为 2% 和 4%， 

cache3: 采用 2- 路 组 相 联 映射 方式 , 块 大 小 为 4 个 字 , 指 令 和 数据 的 缺失 率 分 别 为 2% 
和 3%。 

在 这 些 处 理 器 上 运行 相同 的 程序 ,该 程序 的 CPI 为 2. 0, 其 中 有 一 半 是 访 存 指令 。 若 缺 
失 损失 为 “ 块 大 小 十 6 个 时 钟 周 期 ,处 理 器 1 和 处 理 器 2 的 时 钟 周期 都 为 420ps, 带 有 
cache3 的 处 理 器 3 的 时 钟 周期 为 450ps。 请 问 : 哪个 处 理 器 因 cache 缺失 而 引起 的 额外 开 
销 最 大 ? 哪个 处 理 器 执行 速度 最 快 ? 

【分 析 解 答 】 

假设 所 运行 的 程序 共 执 行 N 条 指令 ,每 条 访 存 指令 仅 读 写 一 次 内 存 数据 , 则 在 该 程序 
执行 过 程 中 各 处 理 器 因 cache 缺失 而 引起 的 额外 开销 和 执行 时 间 计 算 如 下 。 

对 于 处 理 器 1: 额外 开销 为 NX(4% 十 6%X50%)X(1 十 6) = 二 0. 49N 个 时 钟 周期 , 执 
行程 序 所 需 时 间 为 C(NX2. 0 十 0.49N) X420ps 二 1045. 8N(ps); 

对 于 处 理 器 2: 额外 开销 为 NX (2 只 十 4 中 X50%)X(4 十 6) 一 0. 40N 个 时 钟 周期 , 执 
行程 序 所 需 时 间 为 (NX2.0 十 0. 40N) X420ps 二 1008N(ps); 

对 于 处 理 器 3: 额外 开销 为 NX(2% 十 3%X50%)X (4 十 6) = 二 0. 35N 个 时 钟 周 期 , 执 
行程 序 所 需 时 间 为 (NX2. 0 十 0.35N)X450ps 一 1057.5NCps) 。 

由 此 可 见 , 处 理 器 1 cache 缺失 引起 的 额外 开销 最 大 ,处 理 器 2 的 执行 速度 最 快 。 

22. 假定 某 处 理 器 带 有 一 个 数据 区 容量 为 256B 的 cache, 其 块 大 小 为 32B。 以 下 C 语 
言 程序 段 运行 在 该 处 理 器 上 ,sizeof(Cint) 一 4, 编 译 器 将 变量 i,j,c,s 都 分 配 在 通用 寄存 器 
中 ,因此 ,只 要 考虑 数组 元 素 的 访 存 情况 。 若 cache 采用 直接 映射 方式 , 则 当 s 二 64 和 一 63 
时 ,缺失 率 分 别 为 多 少 ? 若 cache 采用 2- 路 组 相 联 映射 方式 , 则 当 s 二 64 和 s 二 63 时 ,缺失 率 
又 分 别 为 多 少 ? 


int i, J Or sr a[ll28]} 


for (i=0; i<10000; i++) 
for (j=0; j<128; j=j+s) 
c=a[j]; 
【分 析 和 解答】 
因为 块 大 小 为 32B, 所 以 每 个 主 存 块 包含 8 个 数组 元 素 ; cache 共有 256B/32B 一 8 行 。 
以 下 仅 考虑 数组 访问 情况 。 
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(1) 直接 映射 ,s 二 64: 访 存 顺序 为 a[0]、a[L64];a[0]、a[L64]、…, 共 循环 10000 次 。 这 
两 个 元 素 被 映射 到 同一 个 cache 行 中 ,每 次 都 会 发 生 冲 突 ,因此 缺失 率 为 100%。 

《2) 直接 映射 ,* 一 63: 访 存 顺序 为 a[0]、a[L63]、a[126];a[0]、a[63]、a[126]、…, 循 环 
10000 次 。 这 3 个 元 素 中 后 面 两 个 元 素 因 为 都 映射 到 同一 个 cache 行 中 ,因此 每 次 都 会 发 生 
冲突 ,而 a[0] 不 会 发 生 冲 突 , 故 缺失 率 约 为 67%。 

(3) 2- 路 组 相 联 ,s* 王 64: 访 存 顺序 为 acL0]、.a[64];a[0]、a[64]、…, 共 循环 10000 次 。 这 
两 个 元 素 虽 然 映 射 到 同一 个 组 中 ,但 可 以 放 在 该 组 不 同 的 cache 行 中 ,因此 , 仅 开 始 两 次 缺 
失 , 缺 失 率 近 似 为 0。 

《4) 2- 路 组 相 联 ,*=63: 访 存 顺序 为 a[0]、a[63]、a[126];a[0]、a[L63]、a[126]、…, 共 
循环 10000 次 。 这 3 个 元 素 中 后 面 两 个 元 素 虽 映射 到 同一 个 组 中 ,但 可 放 在 不 同 cache 行 
中 ,而 a[0] 不 会 发 生 冲 突 ,因此 仅 开始 3 次 缺失 ,缺失 率 近似 为 0。 

23. 假定 一 个 分 页 虚拟 存储 系统 的 虚拟 地 址 为 40 位 ,物理 地 址 为 36 位 ,页 大 小 为 
16KB, 按 字 节 编 址 。 若 页 表 中 有 有 效 位 、 存 储 保护 位 、 修 改 位 \、 使 用 位 共 占 4 位 ,磁盘 地 址 不 
在 页 表 中 , 则 该 存储 系统 中 每 个 进程 的 页 表 大 小 为 多 少 ? 如果 按 计算 出 来 的 实际 大 小 构建 
页 表 , 则 会 出 现 什么 问题 ? 

【分 析 解 答 】 

因为 每 页 大 小 有 16KB, 所 以 虚拟 页 数 为 2 B/16KB 一 24% 网 一 2 页 。 物 理 页 面 和 虚 
拟 页 面 大 小 相等 ,所 以 物理 页 号 ( 实 页 号 ) 的 位 数 为 36 一 14 一 22 位 。 每 个 页 表 项 包括 有 效 
位 、 保 护 位 、 修 改 位 使 用 位 、 物 理 页 号 等 ,所 以 其 位 数 至 少 为 4 十 22 一 26。 为 了 简化 对 页 表 
项 的 访问 ,每 个 页 表 项 取 32 位 。 因 此 ,每 个 进程 的 页 表 大 小 为 2*”X 32b 二 256MB。 如 果 按 
实际 计算 出 的 页 表 大 小 构建 页 表 , 则 构建 出 的 页 表 会 因为 过 大 而 导致 页 表 无 法 一 次 装 人 
内 存 。 

24. 假定 一 个 分 页 虚拟 存储 系统 按 字 节 编 址 ,逻辑 地 址 有 36 位 ,页 大 小 为 16KB, 物 理 
地 址 位 数 为 32 位 ,页 表 中 有 效 位 和 修改 位 各 占 1 位 、 使 用 位 和 存 取 方式 位 各 占 2 位 ,而 且 所 
有 虚拟 页 都 在 使 用 中 。 请 问 : 每 个 进程 的 页 表 大 小 至 少 为 多 少 ? 如 果 所 使 用 的 快 表 (TLB) 
中 总 的 表 项 数 为 256 项 ,采用 2- 路 组 相 联 cache 实现 , 则 快 表 的 大 小 至 少 为 多 少 ? 

【分 析 解 答 】 

因为 页 大 小 为 16KB, 所 以 页 内 地 址 位 数 为 14 位 。 人 逻辑 地 址 为 36 位 ,所 以 虚 页 号 位 数 
为 36 一 14 一 22 ,虚拟 页 数 为 22 个 。 因 此 每 个 进程 的 页 表 项 数 为 22 个 。 物 理 地 址 为 32 位 ， 
所 以 物理 页 号 位 数 为 32 一 14 王 18。 因 此 每 个 页 表 项 的 位 数 为 1 十 1 十 ?十 2 十 18 一 24 位。 所 
以 每 个 进程 的 页 表 大 小 至 少 为 24bX22 一 24X4Mb 一 12MB。 

TLB 中 总 的 表 项 数 为 256 项 ,采用 2- 路 组 相 联 ,所 以 共有 128 组 。22 位 虚拟 页 号 中 低 
7 位 用 来 表示 组 号 ,高 15 位 用 来 作为 标记 ,和 每 组 中 的 标记 进行 比较 ,以 判断 是 否 TLB 命 
中 。 所 以 ,TLB 中 每 个 页 表 项 的 位 数 比 主 存 中 页 表 项 的 位 数 多 了 15 位 的 标记 , 即 TLB 中 
每 个 页 表 项 的 位 数 至 少 为 24 十 15 一 39 位 , 故 整个 快 表 的 大 小 至 少 为 256 X39 一 9984 位 一 
1248 字 节 。 

25. 假定 一 个 计算 机 系统 中 有 一 个 TLB 和 一 个 Ll data cache。 该 系统 按 字 节 编 址 , 虚 
拟 地 址 16 位 ,物理 地 址 12 位 ;页 大 小 为 128B,TLB 为 4- 路 组 相 联 ,共有 16 个 页 表 项 ;L1 
data cache 采用 直接 映射 方式 , 块 大 小 为 4B, 共 16 行 。 在 系统 运行 到 某 一 时 刻 时 ,TLB、 页 
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表 和 L1 data cache 中 的 部 分 内 容 ( 用 十 六 进 制 表示 ) 如 图 4. 8 所 示 。 


组 号 标记 页 框 号 有 效 位 标记 页 框 号 有 效 位 标记 页 框 号 有 效 位 标记 页 框 号 有 效 位 


| 08 | 0 09 | 1D 1 %0 | 一 0 07 | 10 1 

1 13 | 2D 1 02 Ee 0 04 一 0 0OA | 一 0 

2 | 02 一 0 08 一 0 06 一 0 03 | -一 0 

3| 07 | 一 0 63 12 1 0A 34 1 72 | 一 0 

(a) TLB(4- 路 组 相 联 ): 4 组 、16 个 页 表 项 
虚 页 号 ”页 框 号 ”有效 位 行 索引 标记 有 效 位 字 节 3 字 节 2 ” 字 节 1! 字 节 0 
000 08 1 0 19 1 12 56 C9 AC 
001 03 1 1 一 0 
002 14 1 5 1B 1 03 45 12 CD 
003 02 1 3 0 
004 0 4 32 1 23 34 2 2A 
005 16 1 5 | oD 1 46 67 2 3D 
006 0 6 一 0 
007 07 1 7 10 1 12 54 65 DC 
008 13 lL 8 24 1 23 62 12 3A 
009 17 1 9 0 
00A 09 1 A| 2D 1 43 62 23 C3 
00B 一 0 B 0 
00C 19 本 和 C 12 1 76 83 21 35 
00D | 一 Ow | D 16 1 A3 F4 23 11 
00E 11 i E 33 1 2D 4A 45 55 
00F | oD 1 = | F 0 
(b) 部 分 页 表 : (开始 16 项 ) (c)L1 data cache : 直接 映射 ， 共 16 行 ， 块 大 小 为 4B 
图 4.8 题 25 的 TLB、 页 表 和 cache 中 的 部 分 内 容 
请 回答 下 列 问题 ; 


《1) 虚拟 地 址 中 哪 几 位 表示 虚拟 页 号 ? 哪儿 位 表示 页 内 偏 移 量 ? 虚拟 页 号 中 哪 几 位 表 
示 TLB 标记 ? 哪 几 位 表示 TLB 索引 ? 

《2) 物理 地 址 中 哪 几 位 表示 物理 页 号 ? 哪儿 位 表示 页 内 偏 移 量 ? 在 访问 cache 时 , 物 
理 地址 如 何 划分 成 标记 字段 . 行 索引 字段 和 块 内 地 址 字段 ? 

《3) CPU 从 地 址 067AH 中 取出 的 值 为 多 少 ? 要 求 对 CPU 读 取 地 址 067AH 中 内 容 的 
过 程 进 行 说 明 。 

【分 析 解 答 】 

(1) 16 位 虚拟 地 址 中 低 7 位 为 页 内 偏 移 量 ,高 9 位 为 虚 页 号 ; 虚 页 号 中 高 7 位 为 TLB 
标记 , 低 2 位 为 TLB 组 索引 。 

(2) 12 位 物理 地 址 中 低 7 位 为 页 内 偏 移 量 ,高 5 位 为 物理 页 号 ;在 访问 cache 时 ,12 位 
物理 地 址 中 , 低 2 位 为 块 内 地 址 ,中 间 4 位 为 cache 行 索引 ,高 6 位 为 标记 。 

(3) 地 址 067AH 王 0000 0110 0111 1010B, 所 以 , 虚 页 号 为 000001100B, 映 射 到 TLB 的 
第 0 组 ,将 0000011B 一 03H 与 TLB 第 0 组 的 4 个 标记 比较 ,虽然 和 其 中 一 个 相等 ,但 对 应 
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的 有 效 位 为 0, 其 余 都 不 等 ,所 以 TLB 缺失 ,需要 访问 主 存 中 的 慢 表 。 直 接 查看 000001100B 
二 00CH 处 的 页 表 项 ,有 效 位 为 1, 取 出 物理 页 号 19H=11001B, 和 页 内 偏 移 1111010B 拼接 
成 物理 地 址 110011111010B。 由 主 存 物理 地 址 的 划分 知 ,标记 为 110011B, cache 行 索 引 为 
1110B。 根 据 行 索引 “1110” 直 接 找到 cache 第 14 行 (第 刁 行 ), 其 有 效 位 为 1, 且 标记 为 33H 
二 110011B, 正 好 等 于 物理 地 址 高 6 位 的 标记 , 故 命 中 。 因 此 ,根据 物理 地 址 最 低 两 位 <10”， 
取出 字 节 2 中 的 内 容 4AH 王 01001010B。 


| 第 
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指令 系统 


5.1 教学 目标 和 内 容 安排 


主要 教学 目标 : 

使 学 生 了 解 高 级 语言 与 汇编 语言 之 间 、 汇 编 语言 与 机 器 语言 之 间 的 关系 ;掌握 指令 系统 
设计 中 有 关 指 令 格式 、 操 作 数 类 型 . 寻 址 方式 、 操 作 类 型 等 内 容 ; 了 解 高 级 语言 源 程序 如 何 转 
换 为 机 器 级 代码 的 过 程 ; 并 深刻 理解 CISC 和 RISC 之 间 的 差别 。 

基本 学 习 要 求 : 

(1) 理解 引入 高 级 语言 .汇编 语言 和 机 器 语言 的 目的 。 

(2) 了 解 “ 存 储 程序 ”工作 方式 的 内 涵 。 

(3) 了 解 指令 的 基本 格式 及 其 设计 原则 。 

(4) 理解 定 长 操作 码 指令 的 特点 。 

(5) 理解 扩展 操作 码 指令 格式 的 设计 方法 。 

(6) 理解 指令 寻 址 和 有 效 地 址 的 概念 。 

(7) 掌握 常见 寻 址 方式 (立即 直接 、 间 接 、 寄 存 器 .寄存 器 间接 、 变 址 \ 相 对 、 基 址 和 堆栈 
寻 址 方式 ) 。 

(8) 理解 指令 中 地 址 码 的 位 数 与 主 存 地 址 空间 大 小 、 最 小 寻 址 单位 之 间 的 关系 。 

(9) 理解 数据 寻 址 和 指令 寻 址 的 差别 。 

(10) 理解 累加 器 型 指令 的 特点 。 

(11) 理解 堆栈 型 指令 的 特点 。 

(12) 理解 装 入 /存储 型 指令 的 特点 。 

(13) 理解 通用 寄存 器 型 指令 的 特点 。 

(14) 理解 各 种 类 型 指令 的 功能 和 操作 过 程 。 

(15) 理解 分 支 指令 、 跳 转 指令 、 调 用 指令 和 返回 指令 的 特点 和 相互 间 的 区 别 。 

(16) 理解 CISC 和 RISC 的 区 别 和 各 自 的 特点 。 

(17) 了 解 汇编 语言 和 机 器 语言 (指令 代码 ) 之 间 的 对 应 关系 。 

(18) 了 解 高 级 语言 源 程序 和 机 器 语言 (指令 代码 ) 之 间 的 对 应 关系 。 

(19) 了 解 从 高 级 语言 源 程序 到 可 执行 文件 的 转换 过 程 。 


高 级 语言 源 程序 最 终 必须 转换 成 机 器 级 指令 代码 才能 在 机 器 上 运行 ,所 以 ,指令 系统 最 
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根本 的 设计 需求 来 自 高 级 语言 ,因而 ,要 能 够 很 好 地 理解 指令 系统 设计 涉及 的 各 类 问题 ,最 
好 能 够 站 在 高 级 语言 程序 员 的 角度 去 思考 。 例 如 ,对 于 操作 数 类 型 ,因为 在 高 级 语言 中 有 各 
种 不 同 长 度 的 无 符号 整数 、 带 符号 整数 等 数据 类 型 ,所 以 底层 指令 系统 中 也 需要 提供 相应 的 
不 同 长 度 和 不 同类 型 数据 的 支持 ;对 于 操作 类 型 ,因为 高 级 语言 中 存在 各 种 运算 表达 式 ,以 
及 如 循环 和 选择 等 各 类 程序 结构 ,所 以 ,指令 系统 就 必须 能 够 提供 不 同 的 运算 类 指令 和 不 同 
的 程序 控制 类 指令 ;对 于 数据 的 寻 址 方式 ,因为 高 级 语言 中 有 简单 /复合 类 型 变量 、 静 态 / 动 
态 变量 、 全 局 /局 部 变量 等 各 种 属性 数据 的 存在 ,使 得 数据 所 存放 的 位 置 具有 多 样 性 ,例如 ， 
部 分 简单 变量 被 分 配 在 寄存 器 中 存放 ,复合 类 型 变量 分 配 在 存储 器 中 存放 ,全 局 静态 变量 被 
分 配 在 存储 器 的 静态 数据 区 ,动态 变量 在 存储 器 的 堆 区 存放 ,局 部 变量 被 分 配 在 存储 器 的 栈 
区 存放 ,等 等 ,因此 ,指令 需要 能 够 存 取 在 不 同 地 方 存放 的 数据 ,这 就 涉及 寻 址 方式 问题 ,所 
以 , 寻 址 方式 的 多 样 性 是 由 数据 存放 位 置 的 多 样 性 决定 的 。 

此 外 ,指令 系统 的 设计 需求 ,还 有 一 部 分 来 自 操作 系统 。 操 作 系 统 直接 和 硬件 打交道 ， 
它 通过 对 CPU 和 IO 接口 中 各 种 控制 和 状态 寄存 器 ,以 及 内 存 中 专门 的 存储 区 ,进行 直接 
的 访问 来 实现 对 硬件 资源 的 管理 ,因此 ,指令 系统 中 还 必须 提供 这 些 用 来 对 硬件 资源 直接 进 
行 控制 和 管理 的 指令 ,专门 供 操作 系统 内 核 程序 所 用 。 

因此 ,在 本 章 内 容 的 教学 过 程 中 ,应 该 适当 地 结合 高 级 程序 设计 语言 、 编 译 器 和 操作 系 
统 的 一 些 相关 内 容 来 讲解 ,尽量 使 学 生 能 够 在 知 其 然 的 同时 ,也 知 其 所 以 然 。 

在 课时 有 限 的 情况 下 ,指令 系统 实例 和 程序 的 机 器 级 表示 可 以 作为 课外 阅读 材料 ,这 部 
分 内 容 基 本 上 是 具体 的 指令 系统 ,包括 MIPS、Pentium、PowerPC 等 处 理 器 的 指令 系统 ,以 
及 面向 多 媒体 处 理 的 指令 集 。 在 学 习 了 前 面 基本 原理 的 基础 上 ,学 生 通过 阅读 与 具体 的 指 
令 系 统 相 关 的 资料 ,可 以 起 到 巩固 所 学 ,加 深 理解 的 作用 。 

为 了 方便 对 指令 功能 进行 形式 化 描述 ,通常 使 用 寄存 器 传送 级 语言 RTL (Register 
Transfer Language) ,本 书 所 用 的 RTL 表示 约定 为 : RLaj] 表 示 寄 存 器 a 的 内 容 ,M[a] 表示 
内 存单 元 a 的 内 容 ,PC 的 内 容 直 接 用 PC 表示 (请 参照 主教 材 ? 第 230 页 的 说 明 ) 。 


5.2 主要 内 容 提要 


1. 指令 格式 设计 

指令 中 必须 明显 或 隐 含 地 给 出 以 下 信息 : 操作 码 、 操 作 数 或 操作 数 的 地 址 、 结 果 存 放 的 
地 址 ,以 及 下 条 指令 的 地 址 。 通 常 下 条 指令 地 址 隐 含 地 由 程序 计数 器 PC 给 出 。 按 照 指 令 
长 度 的 不 同 可 分 为 定 长 指令 字 格 式 和 变 长 指令 字 格 式 。 根 据 操作 码 长 度 的 不 同 , 也 可 分 为 
定 长 操作 码 指令 格式 和 变 长 操作 码 指令 格式 。 采 用 定 长 指令 字 和 定 长 操作 码 方式 ,可 以 简 
化 指令 地 址 计算 以 及 取 指 和 译 码 操 作 ,加 快 指令 执行 ;采用 变 长 指令 字 和 变 长 操作 码 方式 ， 
则 指令 更 紧凑 ,使 得 程序 所 占 空间 更 少 。 

2， 操 作 类 型 

根据 操作 类 型 的 不 同 ,可 以 将 指令 分 成 以 下 几 类 。 数 据 传送 指令 : 用 于 数据 在 寄存 器 、 
主 存单 元 、 栈 顶 和 I/O 端口 之 间 进 行 传送 ;运算 指令 : 用 于 各 种 算术 运算 和 逮 辑 运算 ;字符 
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串 处 理 指令 : 用 于 字符 串 查 找 、 扫 描 、 转 换 等 ;I/O 指令 : 用 于 CPU 与 外 设 接口 进行 数据 / 状 
态 /命令 信息 的 交换 ;程序 流 控制 指令 : 如 条 件 转移 、 无 条件 转移 、 调 用、 返回 等 指令 ;系统 控 
制 指令 : 用 于 控制 机 器 的 启动 和 停止 ,进行 自愿 访 管 或 自 陷 , 以 及 空 操作 等 。 

3. 操作 数 类 型 

为 了 支持 高 级 语言 中 对 不 同类 型 数据 的 操作 ,必须 提供 对 不 同 数据 类 型 进行 操作 的 指 
令 ,而 且 操 作 数 宽度 也 有 多 种 ,以便 与 高 级 语言 中 各 种 类 型 数据 长 度 对 应 ,如 8 位 、16 位 、32 
位 、64 位 等 。 以 Pentium 处 理 器 ISA 为 例 ,提供 的 数据 类 型 有 以 下 几 类 。 

(1) 序数 或 指针 : 用 8 位 、16 位 或 32 位 无 符号 整数 表示 。 

(2) 带 符号 整数 : 用 8 位 、16 位 、32 位 或 64 位 补 码 表 示 。 

(3) 实数 : 用 IEEE 754 浮 点数 格 式 表示 。 

(4) 十 进 制 整数 : 用 18 位 BCD 码 (80 个 二 进位 ,其 中 符号 占 一 个 字 节 ) 表 示 。 

(5) 字符 串 : 以 字 节 为 单位 的 字符 序列 ,用 ASCII 码 表示 。 

4， 导 址 方式 

编译 器 通常 将 高 级 语言 程序 中 定义 的 各 类 常量 和 变量 所 需要 的 空间 分 配 在 不 同 的 寄存 
器 或 存储 区 中 ,例如 ,简单 变量 可 能 分 配 在 通用 寄存 器 中 ;静态 全 局 数组 变量 分 配 在 存储 空 
间 的 静态 数据 区 ;动态 变量 分 配 在 存储 空间 的 动态 数据 区 ( 堆 区 ) ;局 部 变量 分 配 在 栈 区 ,等 
等 ,而 且 对 于 数组 等 复合 变量 ,通常 在 程序 中 需要 对 每 个 基本 元 素 进行 访问 和 操作 。 因 此 ， 
指令 系统 中 必须 提供 一 套 行 之 有 效 的 寻 址 方式 ,以 方便 CPU 在 执行 指令 时 能 快速 地 定位 
操作 数 所 在 位 置 并 取得 操作 数 。 通 常 将 操作 数 所 在 存储 单元 的 地 址 称 为 操作 数 的 有 效 地 
址 。 指 令 中 提供 的 寻 址 方式 有 以 下 几 种 。 

(1) 立即 寻 址 : 指令 中 直接 给 出 操作 数 本 身 。 

(2) 直接 寻 址 : 指令 的 地 址 码 给 出 操作 数 的 有 效 地 址 。 

(3) 间接 寻 址 : 指令 的 地 址 码 给 出 操作 数 有 效 地 址 的 地 址 。 

(4) 寄存 器 寻 址 : 指令 的 地 址 码 给 出 操作 数 所 在 的 寄存 器 编号 。 

(5) 寄存 器 间接 寻 址 : 指令 的 地 址 码 给 出 操作 数 有 效 地 址 所 在 的 寄存 器 编号 。 

《6) 堆栈 寻 址 : 操作 数 约定 在 堆栈 中 ,总 是 在 栈 项 取 数 或 存 数 。 

(7) 偏 移 寻 址 : 用 寄存 器 内 容 加 形式 地 址 得 到 操作 数 的 有 效 地 址 ,包括 变 址 寻 址 、 相 对 
寻 址 和 基 址 寻 址 3 种 寻 址 方式 。 变 址 寻 址 方式 下 ,地 址 码 给 出 一 个 形式 地 址 ,并 且 隐 式 或 显 
式 地 指定 一 个 寄存 器 作为 变 址 寄存 器 , 变 址 寄存 器 的 内 容 ( 称 为 变 址 值 ) 和 形式 地 址 相 加 ,得 
到 操作 数 的 有 效 地 址 ,通常 用 于 循环 体 中 对 数组 元 素 的 访问 ;相对 寻 址 方式 下 ,指令 中 的 形 
式 地 址 给 出 一 个 位 移 量 D, 而 基准 地 址 由 程序 计 器 PC 提供 。 通 常用 于 转移 指令 中 转移 目 
标 或 公共 子 程序 中 操作 数 的 寻 址 ; 基 址 寻 址 方式 下 ,地 址 码 给 出 的 形式 地 址 作为 位 移 量 ,和 
基 址 寄存 器 的 内 容 相 加 ,得 到 有 效 地 址 。 基 址 寄存 器 可 以 在 指令 中 显 式 指定 由 某 个 通用 寄 
存 器 充当 ,也 可 以 有 一 个 专门 的 基 址 寄存 器 。 

5, 条 件 码 ( 状 态 标 志 ) 的 生成 

对 应 高 级 语言 程序 中 的 选择 结构 和 循环 结构 ,相应 的 机 器 代码 中 需要 有 条 件 转 移 指 令 ， 
它们 根据 不 同 的 状态 标志 来 改变 程序 的 执行 顺序 。 通 常 的 状态 标志 有 CF( 进 / 借 位 标志 )、 
ZF( 零 标志 )、OF( 洲 出 标志 ) 、SF( 符 号 标志 ) 等 。 


站 和 的 


6 指令 系统 风格 

按 地 址 码 指定 风格 来 分 ,可 以 分 成 累加 器 型 .堆栈 型 .通用 寄存 器 型 和 装 入 /存储 型 指令 
系统 。 累 加 器 型 指令 系统 中 ,其 中 一 个 操作 数 和 运算 结果 都 隐 含 存放 在 累加 器 中 ,因而 指令 
长 度 短 , 但 程序 的 指令 条 数 较 多 ,并 需要 频繁 访问 存储 器 ;堆栈 型 指令 系统 中 ,操作 数 和 结果 
都 隐 含 在 堆栈 中 ,因而 指令 中 无 须 指定 地 址 码 ,指令 长 度 短 , 但 需 频 繁 访问 堆栈 ,并 且 对 指令 
序列 的 顺序 要 求 严 格 ,通用 寄存 器 型 指令 系统 中 ,操作 数 明 显 地 指定 在 通用 寄存 器 中 ,使 用 
大 量 通用 寄存 器 ,这 样 既 缩短 了 指令 长 度 , 又 减少 了 访问 存储 器 的 次 数 ,所 以 现代 计算 机 大 
多 采用 这 种 指令 设计 风格 ; 装 人 /存储 型 指令 系统 中 ,只 有 装 人 (Load) 指 令 和 存储 (Store) 指 
令 才 能 访问 内 存 ,而 运算 类 指令 的 操作 数 只 能 在 寄存 器 中 ,这 种 类 型 指令 系统 本 身 是 通用 寄 

按 指 令 系 统 的 复杂 度 来 分 ,可 分 成 CISC( 复 杂 指 令 系统 计算 机 和 RISC( 精 简 指令 系统 
计算 机 ) 两 类 指令 系统 。CISC 指令 系统 大 多 采用 变 长 指令 字 和 扩展 操作 码 编码 ,指令 格式 
多 ,指令 条 数 多 , 寻 址 方式 多 而 复杂 ,因而 指令 的 译 码 实现 复杂 ,大 多 用 微 程 序 控制 器 实现 
RISC 指令 系统 大 多 采用 定 长 指令 字 和 定 长 操作 码 ,指令 格式 少 ,指令 系统 中 仅 含 有 一 些 常 
用 指令 ,因而 指令 条 数 少 , 寻 址 方式 少 且 简单 ,指令 的 译 码 实现 简单 ,可 用 硬 连 线路 控制 器 实 
现 。RISC 处 理 器 中 设置 大 量 的 通用 寄存 器 ,可 大 大 减少 存储 器 访问 次 数 ,并 且 采 用 装 人 / 
存储 型 指令 设计 风格 ,因而 大 部 分 指令 的 执行 步骤 一 致 .规整 ,指令 的 执行 适合 采用 流水 线 
方式 。 

7. MMX 和 SIMD 指令 技术 

多 媒体 数据 处 理 中 存在 大 量具 有 共同 特征 的 操作 ,可 以 提供 一 种 同时 对 多 个 数据 元 素 
进行 相同 操作 的 指令 ,这 种 指令 被 称 为 SIMD(Single Instruction Multi Data) 指 令 。Intel 公 
司 于 1997 年 首次 提供 了 一 组 称 为 MMX(Multi Media Extensions) 技 术 的 指令 ,这 组 指令 可 
以 对 8 个 64 位 寄存 器 中 的 数据 进行 处 理 ,每 个 64 位 数据 可 以 是 8 个 字 节 ,或 4 个 字 , 或 2 
个 双 字 ,或 一 个 64 位 的 四 字 。 

8. 程序 的 机 器 级 表示 

不 管用 哪 种 语言 编写 的 程序 最 终 都 必须 被 转换 成 用 0 和 1 表示 的 机 器 代码 ,也 就 是 指 
令 序列 。 因 为 机 天 代码 可 读 性 差 ,所 以 引入 了 与 机 器 语言 一 一 对 应 的 符号 化 表示 语言 , 称 为 
汇编 语言 。 机 器 语言 和 汇编 语言 都 是 机 器 级 表示 语言 。 程 序 的 机 器 级 表示 主要 是 编译 程序 
和 解释 程序 的 任务 。 但 是 ,对 于 指令 集体 系 结构 (ISA) 的 设计 者 来 说 ,也 必须 了 解 高 级 语言 
与 机 器 级 表示 语言 之 间 的 对 应 关系 。 

通常 ,高 级 语言 中 的 赋值 语句 被 转换 成 由 若干 运算 类 指令 构成 的 指令 序列 ; 像 语句 
这 样 的 选择 结构 程序 段 被 转换 为 一 段 包 含 分 支 指令 (条 件 转移 指令 ) 的 指令 序列 ; 像 for 语 
句 这 样 的 循环 结构 程序 段 被 转换 为 包含 无 条 件 跳 转 指令 和 分 支 指 令 的 被 循环 执行 的 指令 序 
列 。 此 外 ,对 于 高 级 语言 源 程 序 中 的 过 程 调用 ,也 必须 在 ISA 中 有 相应 的 支持 过 程 调用 的 
机 制 , 例 如 ,必须 提供 调用 (转子 ) 指 令 和 过 程 返回 指令 ,同时 ,因为 需要 支持 典 套 调用 和 递归 
调用 ,所 以 还 必须 提供 对 栈 和 栈 帧 的 操作 指令 ,等 等 。 

9， 指 令 系 统 举 例 

以 MIPS 指令 集体 系 结构 为 例 说 明 。MIPS 采用 了 典型 的 RISC 风格 指令 系统 ,提供 了 
32 个 32 位 通用 寄存 器 ,寄存 器 编号 占 5 位 ,各 通用 寄存 器 的 名 称 、 编 导 和 功能 见 表 5. 1。 
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| 表 5.1 MIPS 通用 寄存 器 


名 称 编 号 功 能 

zero 0 恒 为 0 

at 1 为 汇编 程序 保留 

vO~v1 2 过 程 调用 返回 值 

a0 一 a3 4~7 过 程 调用 参数 

t0~t7 8~15 临时 变量 ,在 被 调用 过 程 无 须 保存 
s0~s7 16~23 在 被 调用 过 程 需 保存 

t8~t9 24、25 临时 变 基 ,在 被 调用 过 程 无 须 保存 
ko~kl 26、27 为 OS 保留 

gp 28 全 局 指针 

sp 29 栈 指针 

fp 30 帧 指针 

ra 31 过 程 调用 返回 地 址 


通用 寄存 器 的 汇编 表示 可 以 使 用 名 称 ( 如 $t0), 也 可 以 用 编号 (如 $0)。 此 外 ,MIPS 
中 还 提供 了 32 个 32 位 浮 点 寄存 器 ,两 个 32 位 浮 点 寄存 器 构成 一 个 64 位 双 精 度 浮 点 寄存 
器 。 为 了 实现 乘除 运算 ,MIPS 还 提供 了 两 个 乘 商 寄存 器 Hi 和 Lo, 这 两 个 寄存 器 无 须 在 指 
令 中 明显 给 出 ,因而 ,与 程序 计数 器 PC 一 样 , 它 们 没有 寄存 器 编号 。 

MIPS 采 用 三 地 址 指令 格式 , 表 5.2 给 出 了 MIPS 汇编 语言 示例 列表 。 


表 5.2 MIPS 汇编 语言 示例 列表 


类 别 指令 名 称 汇编 举例 含 居 备 注 

算术 | add add $sl,$s2,$s3 | $sl=$s2+$s3 三 个 寄存 器 操作 数 

运算 | subtract sub $s1,$s2,$s3 | $s1l=$s2— $s3 三 个 寄存 器 操作 数 

存储 | load word lw $ sl1,100C $ s2) $ sl 二 ML[ $ s2 十 100] | 从 内 存 取 一 个 字 到 寄存 器 

访问 | store word sw $s1,100($ s2) | M[$s2 十 100]= $sl | 从 寄存 器 存 一 个 字 到 内 存 
and and $sl1, $s2,$s3 $sl=$s2& $s3 三 个 寄存 器 操作 数 , 按 位 与 
or or $sl,$s2,$s3 $sl=$s2|$s3 三 个 寄存 器 操作 数 , 按 位 或 
nor nor $sl, $s2, $s3 $ sl 二 ~($ s2 | $ s3) | 三 个 寄存 器 操作 数 , 按 位 或 非 

二 and immediate | andi $sl,$s2,100 | $sl 二 $s2 & 100 | 寄存 器 和 常数 , 按 位 与 
or immediate ori $ sl, $ s2,100 $sl= $s2 | 100 寄存 器 和 常数 , 按 位 或 
shift left logical | sll $ sl1, $ s2,10 $ sl= $ s2<<10 按 常 数 对 寄存 器 逻辑 左 移 
shift right logical | srl $ sl1, $ s2,10 $ sl= $ s2>>10 按 常数 对 寄存 器 逻辑 右 移 


branch on equal | beq $ sl1, $ s2,L 过 ($s1 二 二 $s2) gotoL | 相等 则 转移 


branch on not 


bne $s1, $s2,L 
equal 


这 $sl! 一 $s2) go to L | 不 相等 则 转移 
条 件 


分 支 | set on less than | slt $sl,$s2,$s3 


这 $s2<<$s3)$s1 一 1; | 小 于 则 置 寄 存 器 为 1, 否 则 为 
else $ sl=0 0, 用 于 后 续 指令 判 0 


if( $ s2<<100) $ s1 一 1; | 小 于 常数 则 置 寄存 器 为 1, 否 
else $ sl=0 则 为 0, 用 于 后 续 指 令 判 0 


gotoL 直接 跳 转 至 目标 地 址 
go to $ra 过 程 返回 
$ ra 二 PC 十 4; go to L | 过 程 调 用 


t 1 
0 slti $ s1, $ s2,100 


than immediate 


jump j 


件 中 | jump register 护 $ra 


jump and link jal EB 


5.3 基本 术语 解释 


指令 (Instruction) 

是 计算 机 硬件 能 够 识别 并 直接 执行 的 操作 命令 。 用 二 进 制 序列 表示 ,由 操作 码 和 地 址 
码 两 部 分 组 成 。 

指令 系统 (Instruction Set) 

也 称 指令 集 , 是 计算 机 中 所 有 指令 的 集合 。 

指令 集体 系 结构 (Instruction Set Architecture,ISA) 

是 计算 机 硬件 与 系统 软件 之 间 的 接口 ,其 核心 部 分 是 指令 集 , 同 时 还 包含 数据 类 型 和 数 
据 格 式 定义 .寄存 器 设计 .IO 空间 的 编 址 和 数据 传输 方式 、 中 断 结构 、 计 算 机 状态 的 定义 和 
切换 、 存 储 保护 等 。 

指令 字 长 (Instruction Length) 

一 条 指令 的 二 进 制 代码 位 数 。 有 定 长 指令 字 机 器 和 变 长 指令 字 机 器 。 

定 长 指令 (Fixed Length Instruction) 

机 器 中 所 有 指令 的 位 数 是 相同 的 ,目前 定 长 指令 字 大 多 是 32 位 指令 字 。 

变 长 指令 (Variable Length Instruction) 

机 器 的 指令 有 长 有 短 ,但 每 条 指令 的 长 度 一 般 都 是 8 的 倍数 。 

操作 码 (Operate Code) 

指令 中 用 于 指出 操作 性 质 的 字段 。 一 般 分 为 定 长 操作 码 和 扩展 操作 码 。 定 长 操作 码 指 
机 器 中 所 有 指令 的 操作 码 字段 位 数 相 同 。 扩 展 操作 码 的 机 器 中 指令 的 操作 码 字段 位 数 不 都 
相同 ,也 称 为 不 定 长 操作 码 。 

地 址 码 (Address Code) 

指令 中 用 于 指出 操作 数 地 址 的 字段 。 一 条 指令 中 一 般 有 多 个 地 址 码 字 段 。 地 址 码 字段 
的 个 数 与 许多 因素 有 关 。 一 个 地 址 码 字段 可 能 是 一 个 立即 数 ; 可 能 是 一 个 直接 地 址 ;可 能 是 
一 个 间接 地 址 ;可 能 是 寄存 器 编号 ;可 能 是 I/O 端口 号 ;可 能 是 一 个 形式 地 址 等 。 
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大 端 序 (Big Endian Ordering) 

操作 数 在 主 存 存放 时 ,指令 中 给 出 的 地 址 是 操作 数 最 高 有 效 字 节 (MSB) 所 在 的 地 址 。 
例如 ,假设 一 个 32 位 数据 "12345678H” 的 地 址 为 100, 则 12H、34H、56H 和 78H 分 别 存 放 
在 第 100、101、102 和 103 号 单元 中 。IBM S/370 ,Motorola 680x0 等 是 大 端 序 机 器 。 

小 端 序 (Little Endian Ordering) 

操作 数 在 主 存 存放 时 ,指令 中 给 出 的 地 址 是 操作 数 最 低 有 效 字 节 (LSB) 所 在 的 地 址 。 
例如 ,假设 一 个 32 位 数据 “12345678H” 的 地 址 为 100, 则 12H、34H、56H 和 78H 分 别 存放 
在 第 103、102、101 和 100 号 单元 中 。JIntel 80x86 等 是 小 端 序 机 器 。 

字 地 址 (Word Address) 

每 个 主 存单 元 都 有 一 个 地 址 ,假定 机 器 中 一 个 字 为 32 位 , 按 字 节 编 址 ,那么 字 地 址 就 是 
指 具 有 4 的 倍数 的 那些 地 址 ,如 0、4、8、12、…; 对 应 的 还 有 半 字 地 址 (2 的 倍数 ,如 0、2、4、 
6、…)、 双 字 地 址 (8 的 倍数 ,如 0、8、16、…)。 

边界 对 齐 (Boundary Alignment) 

有 些 机 器 在 操作 数 存 放 到 主 存单 元 时 ,要 求 按照 相应 的 地 址 边界 进行 对 齐 。 如 假定 机 
器 中 一 个 字 为 32 位 , 按 字 节 编 址 ,那么 一 个 32 位 的 数据 (如 一 个 float 型 的 变量 或 32 位 的 
int 型 整数 变量 等 ) 就 必须 存放 在 字 地 址 上 ;一 个 16 位 的 数 ( 如 16 位 short 型 的 短 整数 等 ) 就 
必须 放 在 半 字 地 址 上 ;而 8 位 的 数据 (如 char 型 字符 ) 就 可 以 放 在 任何 边界 地 址 上 而 不 需 
对 齐 。 

累加 器 (Accumulator) 

在 CPU 中 ,累加 器 (Accumulator, AC 或 ACC) 是 一 种 暂 存 器 ,用 来 储存 计算 所 产生 的 
中 间 结 果 。 早 期 机 器 中 没有 通用 寄存 器 组 ,只 有 一 个 累加 器 ,这 种 情况 下 ,如 果 没 有 像 累 加 
器 这 样 的 暂 存 器 ,那么 在 每 次 计算 后 就 必须 要 把 结果 写 回 到 主 存 , 然 后 可 能 还 要 再 读 回 来 。 
这 样 , 就 会 增加 访问 主 存 的 次 数 , 降 低 程序 运行 的 效率 。 典 型 的 例子 就 是 把 一 列 数字 加 起 
来 。 一 开始 累加 器 设 定 为 零 , 每 个 数字 依 序 被 加 到 累加 器 中 , 当 所 有 数字 都 被 加 入 后 ,结果 
才 写 回 到 主 存 中 ,而 不 必 每 次 都 写 主 存 。 

程序 计数 器 (Program Counter,PC) 

又 称 指令 计数 器 或 指令 指针 全 ,是 一 个 特殊 的 地 址 寄存 器 ,专门 用 来 存放 下 一 条 要 执 
行 指令 的 地 址 。 因 为 本 身 它 是 个 寄存 器 ,所 以 也 称 为 指令 指针 寄存 器 或 指令 地 址 寄存 器 。 
通常 程序 是 顺序 执行 的 ,程序 的 指令 序列 在 主 存 中 一 般 也 是 按 连续 地 址 存放 的 。 在 开始 运 
行程 序 之 前 ,总 是 将 第 一 条 指令 的 地 址 放 和 人 PC; 每 取出 一 条 指令 并 执行 后 ,控制 器 就 使 PC 
的 内 容 自 动 增 量 (加 上 当前 指令 的 长 度 ) ,指明 下 一 条 要 执行 的 指令 所 存放 的 存储 单元 地 址 ， 
从 而 可 以 控制 指令 的 顺序 执行 ;在 遇 到 需要 改变 程序 执行 顺序 的 情况 时 ,一 般 由 转移 类 指令 
将 转移 目标 地 址 送 往 程序 计数 器 , 即 可 实现 程序 的 转移 。 

指令 寄存 器 (Instruction Register) 

指令 寄存 器 (Instruction Register,IR) 用 来 保存 当前 正在 执行 的 一 条 指令 。 当 执行 一 
条 指令 时 , 先 从 存储 器 取出 指令 ,然后 送 至 指令 寄存 器 。 指 令 寄存 器 中 的 操作 码 部 分 被 送 到 
指令 译 码 器 ID(Instruction Decoder) 中 ,经 ID 译 码 (识别 这 条 指令 的 功能 ) 后 ,送出 具体 的 
操作 控制 信号 。 
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程序 状态 字 (Program Status Word,PSW) 

表示 程序 运行 状态 的 一 个 二 进 制 位 序列 。 一 般 包 含 一 些 反映 指令 执行 结果 的 标志 信息 
(如 进位 标志 、 洲 出 标志 、 符 号 标志 等 ;和 设 定 的 一 些 状态 信息 (如 中 断 允许 /禁止 状态 、 管 理 
程序 /用 户 程 序 状态 等 )。 

程序 状态 字 寄 存 器 (Program Status Word Register, PSWR) 

用 来 存放 程序 状态 字 的 寄存 器 。 

标志 寄存 器 (Flags Register) 

80x86 体系 结构 中 用 来 表示 程序 状态 和 标志 的 寄存 器 。 

堆栈 (Stack) 

堆栈 是 一 块 特殊 的 存储 区 。 采 用 “先进 后 出 ”的 方式 进行 访问 。 主 要 用 来 在 程序 切换 
〈 如 过 程 调用 ?时 保存 各 种 信息 。 栈 底 固 定 不 动 , 栈 顶 浮 动 ,用 一 个 专门 的 寄存 器 (SP) 来 作 
为 栈 顶 指针 。 从 堆栈 生长 的 方向 来 分 ,有 “ 自 顶 向 下 ”和 “ 自 底 向 上 ”两 种 堆栈 。 从 堆栈 的 位 
置 来 分 ,有 硬 堆 栈 和 软 堆栈 。 硬 堆栈 的 堆栈 区 由 寄存 器 实现 , 软 堆栈 的 堆栈 区 由 一 个 主 存 区 
域 实现 。 

堆栈 指针 (Stack Pointer, SP) 

是 一 个 特殊 的 地 址 寄存 器 ,用 来 存放 堆栈 的 栈 顶 指针 。 如 果 是 硬 堆栈 , 栈 顶 指针 是 栈 顶 
寄存 器 的 编号 ;如 果 是 软 堆栈 , 栈 顶 指针 是 栈 顶 主 存单 元 的 地 址 。 

双 目 运算 (Two-operand Operate) 

需要 两 个 操作 数 才能 进行 的 运算 。 如 加 、 减 、 乘 、 除 、 与 .或 等 算术 或 逻辑 运算 都 是 双 目 
运算 。 

单 目 运算 (One-operand Operate) 

只 需要 一 个 操作 数 就 能 进行 的 运算 。 如 取 负 、 取 反 等 算术 或 逻辑 运算 都 是 单 目 运算 。 

寻 址 方式 (Addressing Mode) 

在 程序 执行 过 程 中 ,需要 取 指 令 和 操作 数 ,确定 指 令 和 操作 数 的 存放 位 置 的 方式 称 为 寻 
址 方式 。 确 定 指令 存放 位 置 的 过 程 称 为 指令 寻 址 ,确定 操作 数 存放 位 置 的 过 程 称 为 数据 
寻 址 。 

有 效 地 址 (Effective Address) 

存储 器 操作 数 所 在 存储 单元 的 地 址 。 若 不 采用 虚拟 存储 机 制 , 则 有 效 地 址 是 主 存 地 址 ; 
若 采 用 虚拟 存储 机 制 , 则 有 效 地 址 是 虚拟 地 址 。 

立即 寻 址 (Immediate Addressing) 

指令 中 的 地 址 码 直 接 给 出 操作 数 本 身 。 

直接 寻 址 (Direct Addressing) 

指令 中 的 地 址 码 给 出 的 是 操作 数 所 在 的 存储 单元 地 址 , 即 有 效 地 址 , 称 为 直接 地 址 。 

间接 寻 址 (Indirect Addressing) 

指令 中 的 地 址 码 给 出 的 是 操作 数 有 效 地 址 的 地 址 , 称 为 间接 地 址 。 

寄存 器 寻 址 (Register Addressing) 

指令 中 的 地 址 码 给 出 的 是 操作 数 所 在 的 寄存 器 的 编号 。 

寄存 器 间接 寻 址 (Register Indirect Addressing) 

指令 中 的 地 址 码 给 出 的 是 操作 数 的 有 效 地 址 所 在 的 寄存 器 的 编号 。 
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偏 移 寻 址 (Displacement Addressing) 

指令 通过 某 种 方式 给 出 一 个 形式 地 址 和 一 个 基地 址 (往往 在 某 个 寄存 器 中 ) ,经 过 相应 
的 计算 (基地 址 加 形式 地 址 ) 得 到 操作 数 的 有 效 地 址 。 具 体 的 偏 移 寻 址 方式 有 : 变 址 寻 址 、 
相对 寻 址 和 基 址 寻 址 。 

变 址 寻 址 (Indexing Addressing) 

变 址 寻 址 方式 下 ,指令 中 的 地 址 码 给 出 一 个 形式 地 址 ,并 且 隐 含 或 明显 地 指定 一 个 寄存 
器 作为 变 址 寄存 器 , 变 址 寄存 器 的 内 容 ( 变 址 值 ) 和 形式 地 址 相 加 ,得 到 操作 数 的 有 效 地 址 ， 
根据 有 效 地址 访问 内 存 ,去 取 操作 数 或 写 运算 结果 。 

变 址 寄存 器 (Index Register) 

是 一 个 特殊 的 地 址 寄存 器 ,用 来 存放 变 址 寻 址 方式 下 的 变 址 值 ,通常 是 数组 元 素 的 下 标 
值 或 相对 数组 首 地 址 的 偏 移 量 。 

相对 寻 址 (Relative Addressing) 

相对 寻 址 方式 下 ,指令 中 的 形式 地 址 给 出 一 个 位 移 量 D, 而 基准 地 址 由 程序 计数 器 PC 
提供 。 即 有 效 地 址 为 PC 的 内 容 与 位 移 量 D 之 和 。 位 移 量 D 可 正 可 负 , 也 就 是 说 , 需 访 问 的 
信息 可 以 在 当前 指令 之 前 D 个 单元 处 ,也 可 以 在 当前 指令 之 后 D 个 单元 处 。 

基 址 寻 址 (Base Addressing) 

基 址 寻 址 方式 下 ,指令 中 的 地 址 码 给 出 一 个 形式 地 址 ,作为 位 移 量 ,并 且 隐 含 或 明显 地 
指定 一 个 寄存 器 作为 基 址 寄存 器 , 基 址 寄存 器 的 内 容 和 形式 地 址 相 加 ,得 到 操作 数 的 有 效 地 
址 ,根据 有 效 地 址 访问 内 存 , 去 取 操 作 数 或 写 运算 结果 。 

基 址 寄存 器 (Base Register) 

是 一 个 特殊 的 地 址 寄存 器 ,用 来 存放 基 址 寻 址 方式 下 的 基准 地 址 。 通 常 是 一 个 用 户 程 
序 在 主 存 的 首 地 址 ,或 一 块 存储 区 的 首 地 址 。 

堆栈 寻 址 (Stack Addressing) 

堆栈 寻 址 方式 下 ,操作 数 被 指定 在 堆栈 中 。 堆 栈 寻 址 总 是 从 栈 顶 取 操 作 数 ,运算 后 的 结 
果 自 动 放 到 栈 项 。 栈 项 的 位 置 由 一 个 专门 的 堆栈 指针 SP 来 指示 。 所 以 ,指令 中 不 需 给 出 
操作 数 地 址 ,是 一 种 零 地 址 指令 。 与 堆栈 有 关 的 操作 有 : 人 栈 (PUSH) .出 栈 (POP) 和 运算 
类 操作 。 

通用 寄存 器 (General Purpose Register,GPR) 

一 般 把 用 户 可 访问 寄存 器 称 为 通用 寄存 器 (GPR) 。 这 些 寄存 器 都 有 一 个 编号 ,在 指令 
中 用 编号 标识 寄存 器 。 所 以 执行 指令 时 ,指令 中 的 寄存 器 编号 要 送 到 一 个 地 址 译 码 器 进行 
译 码 ,然后 才能 选中 某 个 寄存 器 进行 读 写 。 通 用 寄存 器 可 以 用 来 存放 操作 数 或 运算 结果 ,或 
作为 地 址 指针 寄存 器 、 变 址 寄存 器 、 基 址 寄存 器 等 。 

RR 型 指令 (Register-Register Type Instruction) 

两 个 操作 数 都 在 寄存 器 中 的 指令 。 

RS 型 指令 (Register-Storage Type Instruction) 

一 个 操作 数 在 寄存 器 中 , 另 一 个 操作 数 在 主 存 单元 中 的 指令 。 

SS 型 指令 (Storage-Storage Type Instruction) 

两 个 操作 数 都 在 主 存单 元 中 的 指令 。 

数据 传送 指令 (Data Transfer Instruction) 

将 数据 在 寄存 器 和 寄存 器 之 间 、 存 储 器 单元 和 寄存 器 之 间 进 行 传送 的 指令 。 


取 数 指令 (Load) 

特 指 将 数据 从 内 存单 元 取 到 寄存 器 的 指令 。 

存 数 指令 (Store) 

特 指 将 数据 从 寄存 器 保存 到 内 存单 元 的 指令 。 

相对 转移 (Relative Jump) 

转移 目标 地 址 通过 PC 的 值 加 上 一 个 偏 移 量 形成 。 所 以 ,转移 到 的 目的 地 和 当前 指令 
的 位 置 有 关 。 

绝对 转移 (Absolute Jump) 

转移 目标 地 址 由 指令 指定 的 一 个 绝对 地 址 确定 ,而 与 当前 指令 的 位 置 关系 不 大 。 

条 件 转移 (Conditional Jump ,Branch) 

是 一 种 分 支 指令 ,也 称 为 条 件 分 支 。 根 据 前 面 指令 或 本 条 指令 执行 的 结果 确定 是 跳 转 
到 转移 目标 地 址 处 执行 ,还 是 顺序 执行 。 

无 条 件 转 移 (Unconditional Jump) 

是 一 种 直接 跳 转 指令 ,执行 完 本 条 指令 后 ,无条件 地 跳 转 到 目标 转移 地 址 处 执行 。 

过 程 (Procedure) 

构造 过 程 或 子 程序 是 程序 员 进 行 模块 化 程序 设计 的 一 种 手段 ,通常 程序 员 把 一 个 大 的 
任务 分 解 成 一 些 子 任务 ,每 个 子 任务 用 一 个 过 程 来 实现 ,这 样 做 ,一 方面 使 得 程序 容易 理解 ， 
另 一 方面 也 使 过 程 可 以 被 多 个 程序 使 用 , 即 可 重用 代码 。 

过 程 调 用 (Procedure Call) 

一 个 过 程 调用 包括 将 数据 (以 过 程 参 数 和 返回 值 的 形式 出 现 ) 和 控制 从 一 个 程序 传递 到 
男 一 个 程序 。 此 外 ,在 进入 过 程 时 ,必须 为 过 程 的 局 部 变量 分 配 空间 ,并 在 退出 过 程 时 释放 
这 些 空间 。 

跳 转 链接 指令 (Jump and Link Instruction) 

用 于 将 控制 从 调用 程序 转移 到 被 调用 程序 的 指令 。 在 MIPS 指令 系统 中 它 称 为 跳 转 链 
接 指 令 jal。 在 有 些 机 器 的 指令 系统 中 也 被 称 为 过 程 调用 指令 (Call Instruction) 或 转子 指令 
(意思 为 转移 到 子 程 序 ) ,如 在 x86 体系 结构 中 的 Call 指令 。 在 这 类 调用 指令 中 ,需要 给 出 
被 调用 程序 的 首 地 址 。 其 主要 操作 过 程 为 保存 返回 地 址 到 特定 的 寄存 器 或 堆栈 并 跳 转 到 被 
调用 程序 。 

返回 地 址 (Return Address) 

跳 转 链接 指令 (调用 指令 ?后 面 的 一 条 指令 的 地 址 。 即 被 调用 程序 执行 完 后 必须 返回 的 
返回 点 。 

返回 指令 (Return Instruction) 

用 于 从 被 调用 程序 控制 转 回 到 调用 程序 的 指令 。 该 指令 从 某 个 特定 的 寄存 器 或 当前 栈 
顶 取 得 返回 地 址 ,并 按 返 回 地 址 进行 跳 转 。 

调用 程序 (Caller) 

在 过 程 调用 中 ,通过 过 程 调用 指令 调用 一 个 过 程 或 子 程序 的 程序 。 有 时 也 称 为 主 程序 。 

被 调用 程序 (Callee) 

用 过 程 调用 指令 (或 称 为 跳 转 链接 指令 ) 所 调用 的 程序 。 被 调用 程序 最 后 必须 用 返回 指 
令 返 回 到 调用 程序 中 调用 指令 后 面 的 那 条 指令 继续 执行 。 
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时 过 程 (Leaf Procedure) 

不 调用 任何 过 程 的 过 程 。 

过 程 帧 (Procedure Frame) 

过 程 调用 中 的 参数 传递 .被 调用 过 程 中 的 局 部 变量 的 分 配 和 释放 等 需要 专门 的 机 制 来 
实现 。 主 要 是 通过 栈 (Stack) 来 实现 , 栈 用 来 传递 过 程 参数 .存储 返回 信息 、 保 存 寄 存 器 和 过 
程 局 部 变量 等 。 为 单个 过 程 分 配 的 那 部 分 栈 区 称 为 过 程 帧 ,也 称 为 栈 帧 (Stack Frame) 。 

帧 指针 《Frame Pointer) 

在 程序 运行 过 程 中 ,可 能 会 有 多 个 过 程 被 嵌 套 调用 ,每 个 未 返回 的 过 程 都 有 一 个 过 程 
帧 ,当前 正在 执行 的 过 程 帧 称 为 当前 帧 。 它 由 两 个 指针 来 定 界 , 一 个 是 指示 当前 帧 底部 的 帧 
指针 fp, 另 一 个 是 指示 当前 帧 顶部 的 栈 指针 sp。 

源 程 序 文 件 (Source Program File) 

用 某 种 高 级 语言 书写 的 源 程 序 文件 。 如 C 语言 源 程序 文件 x*.c 等 。 

汇编 语言 程序 文件 (Assemble Language Source File) 

用 某 种 汇编 语言 书写 的 源 程 序 文件 。 如 UNIX 系统 中 的 汇编 语言 源 程 序 文件 * .s, 或 
MS-Windows 中 的 * .asm 文件 等 。 

目标 程序 文件 (Object/Target Program File) 

编译 程序 和 汇编 程序 对 源 程 序 进行 翻译 处 理 所 得 到 的 机 器 语言 程序 称 为 目标 程序 文 
件 , 是 由 机 器 指令 组 成 的 二 进 制 代 码 。 如 UNIX 系统 中 的 *.o 文 件 ,或 MS-Windows 系统 
中 的 * .obj 文件 等 。 一 般 而 言 , 目 标 程序 文件 中 包含 目标 文件 头 \ 文 本 段 ( 机 器 代码 )\ 数 据 
段 . 重 定位 信息 、 符 号 表 、 调 试 信息 等 。 因 为 目标 文件 是 可 重 定位 的 ,所 以 也 称 为 可 重 定位 目 
标 文件 。 

可 执行 程序 文件 (Executable Program File) 

通过 装 和 人 程序 直接 装 人 存储 器 执行 的 文件 。 一 般 而 言 , 可 执行 程序 文件 除了 不 包含 未 
确定 的 调用 信息 、 重 定位 信息 、 符 号 表 和 调试 信息 外 , 它 与 目标 程序 文件 有 相同 的 格式 。 可 
执行 程序 文件 中 的 模块 可 以 调用 其 他 动态 链接 库 中 的 函数 。 

链接 程序 (Linker/Link Editor) 

把 编译 或 汇编 好 的 多 个 目标 程序 文件 和 一 些 库 函数 目标 文件 链接 生成 一 个 可 执行 程序 
文件 的 工具 软件 。 

装 入 程序 (Loader) 

也 称 为 加 载 器 或 加 载 程序 。 用 于 将 可 执行 程序 文件 读 人 存储 器 并 启动 执行 的 工具 软 
件 。 一般 来 说 ,可 执行 文件 的 装 人 是 由 操作 系统 内 核 来 实现 的 ,因此 加 载 程序 属于 操作 系统 
的 一 部 分 。 

全 局 指针 (Global Pointer) 寄 存 器 

操作 系统 通过 执行 装载 程序 把 一 个 可 执行 文件 装 人 存储 器 时 ,必须 按照 一 定 的 存储 映 
像 使 用 存储 空间 。 基 于 MIPS 处 理 器 的 系统 通常 将 存储 空间 分 为 3 个 部 分 ,第 一 部 分 是 从 
0x00400000 开始 的 正文 段 , 用 于 存放 程序 代码 ;第 二 部 分 是 数据 段 , 分 成 静态 数据 段 和 动态 
数据 段 两 部 分 ,静态 数据 段 从 0x10000000 开始 ,其 上 是 动态 数据 段 , 随 着 程序 的 执行 进行 动 
态 分 配 , 向 上 扩展 (从 低地 址 向 高 地 址 增长 ); 第 三 部 分 是 程序 的 堆栈 段 ,处 于 存储 地 址 空间 
的 最 上 端 , 从 地 址 0x7FFFFFFF 开始 向 下 扩展 (从 高 地 址 向 低地 址 增长 )。MIPS 处 理 器 为 
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了 方便 地 实现 对 静态 数据 区 的 访问 ,把 地 址 0x10008000 放 在 一 个 专门 的 寄存 器 $ gp 中 ,将 
其 作为 指向 静态 数据 段 的 全 局 指针 。 这 样 在 Load 和 Store 指令 中 用 16 位 偏 移 量 就 可 以 对 
静态 数据 段 的 前 64KB 的 区 域 进 行 方 便 存 取 。 

伪 指 令 (Pseudo Instruction) 

汇编 语言 中 使 用 的 但 在 机 器 语言 中 不 存在 的 机 器 指令 。 通 常 在 汇编 语言 源 程序 中 用 一 
条 更 加 简洁 自然 的 伪 指 令 来 表示 多 条 机 器 指令 ,它们 在 功能 上 等 价 。 汇 编程 序 在 进行 汇编 
时 ,将 伪 指 令 转换 为 等 价 的 机 器 指令 序列 。 

CISC(Complex Instruction Set Computer) 

复杂 指令 集 计 算 机 。 早 期 的 计算 机 为 了 增加 功能 和 更 好 地 支持 高 级 语言 而 不 断 地 增加 
新 的 指令 类 型 ,使 系统 可 以 实现 复杂 的 操作 。 这 种 指令 系统 功能 复杂 , 寻 址 方式 多 ,指令 长 
度 可 变 ,指令 格式 多 样 。 因 而 采用 这 种 指令 系统 的 计算 机 被 称 为 复杂 指令 集 计算 机 。 

RISC(Reduced Instruction Set Computer) 

精简 指令 集 计算 机 。 这 种 计算 机 采用 简化 的 指令 系统 ,指令 集中 只 包含 程序 中 常用 的 
指令 ,运算 类 指令 只 能 是 R-R 型 ,提供 大 量 通 用 寄存 器 以 减少 访 存 次 数 ,采用 流水 线 方式 执 
行 指令 ,控制 器 用 硬 连 阵 列 逻 辑 实 现 , 并 采用 优化 的 编译 技术 。 


5.4 常见 问题 解答 


1. 一 台 计 算 机 中 的 所 有 指令 都 是 一 样 长 吗 ? 

答 : 不 一 定 。 有 定 长 指令 字 机 器 和 不 定 长 指令 字 机 器 两 种 。 定 长 指令 字 机 器 中 所 有 指 
令 都 一 样 长 , 称 为 规整 型 指令 ,目前 定 长 指令 字 大 多 是 32 位 指令 字 。 不 定 长 指令 字 机 器 的 
指令 有 长 有 短 , 但 每 条 指令 的 长 度 一 般 都 是 8 的 倍数 。 所 以 ,一 个 指令 字 在 存储 器 中 存放 
时 ,可 能 占用 多 个 存储 单元 ;从 存储 器 读 出 并 通过 总 线 传输 时 ,可 能 分 多 次 进行 ,也 可 能 一 次 
读 多 条 指令 。 

2. 每 一 条 指令 中 都 包含 操作 码 吗 ? 

答 : 是 的 。 每 一 条 指令 都 必须 告诉 CPU 该 指令 做 什么 操作 ,所 以 必须 指定 操作 码 。 

3. 每 条 指令 中 的 地 址 码 个 数 都 一 样 吗 ? 

答 : 不 一 定 , 有 的 没有 地 址 码 , 有 的 包含 一 个 地 址 码 , 有 的 是 两 个 或 三 个 地 址 码 。 地 址 
码 个 数 不 一 样 的 主要 原因 有 3 个 : (1) 每 条 指令 的 操作 数 个 数 可 能 不 同 。 有 的 指令 是 双 目 
运算 指令 ,涉及 两 个 源 操作 数 和 目 操作 数 , 有 的 是 单 目 运算 ,只 涉及 一 个 源 操作 数 和 目 操作 
数 ,还 有 的 指令 只 是 控制 操作 ,不 涉及 操作 数 ,如 停机 、 复 位 、 空 操作 等 指令 。 所 以 每 条 指令 
涉及 的 操作 数 个 数 不 同 。(2) 每 个 操作 数 的 寻 址 方式 可 能 不 同 。 而 不 同 的 寻 址 方式 给 出 的 
地 址 码 个 数 也 不 同 。(3) 地 址 码 的 缺 省 方式 可 能 不 同 。 有 的 操作 数 或 地 址 码 用 的 是 隐 含 指 
定 方式 ,在 指令 中 缺 省 ,不 明显 给 出 ,如 累加 器 ,堆栈 等 。 综 上 所 述 ,每 条 指令 的 地 址 码 个 数 
可 能 相差 很 大 。 

4. 指令 中 的 所 有 操作 数 都 采用 相同 的 寻 址 方式 吗 ? 

答 : 不 一 定 。 规 整 型 指令 一 般 在 一 条 指令 中 只 包含 一 种 寻 址 方式 ,这 样 ,在 指令 操作 码 
中 就 隐 含 了 寻 址 方式 ,不 需要 专门 有 寻 址 方式 字段 。 但 是 ,对 于 不 规整 型 指令 ,一 条 指令 中 
的 若干 操作 数 可 能 存放 在 不 同 地 方 ,因而 每 个 操作 数 可 能 有 各 自 的 寻 址 方式 。 


计算 规 组 成 与 系统 结 欧 习题 解答 与 塌 学 指导 


SS， 指令 中 要 明显 给 出 下 一 条 指令 的 地 址 吗 ? 

答 : 不 需要 。 指 令 在 主 存 中 按 执行 顺序 连续 存放 。 大 多 数 情况 下 指令 被 顺序 执行 ,只 
有 遇 到 转移 指令 (如 无 条 件 转移 条件 分 支 . 调 用 和 返回 等 指令 ) 才 改变 指令 执行 的 顺序 。 所 
以 ,可 以 用 一 个 专门 的 计数 器 ,来 存放 下 一 条 要 执行 的 指令 地 址 ,而 不 需要 在 指令 中 专门 给 
出 下 一 条 指令 的 地 址 。 这 个 计数 器 称 为 程序 计数 器 PC 或 指令 指针 IP。 

当 顺 序 执行 时 ,CPU 直接 通过 对 PC 加 “1” 来 使 PC 指向 下 一 条 顺序 执行 的 指令 ; 当 执 
行 到 转移 指令 时 ,根据 指令 执行 的 结果 进行 相应 的 地 址 运算 ,把 运算 得 到 的 转移 目标 地 址 送 
到 PC 中 ,使 得 执行 的 下 一 条 指令 为 转移 到 的 目标 指令 。 

6. 一 个 操作 数 在 主 存 中 可 能 占 多 个 单元 ,怎样 在 指令 中 给 出 操作 数 的 地 址 呢 ? 

答 : 现代 计算 机 大 多 采用 字 节 编 址 方式 , 即 一 个 主 存单 元 只 能 存放 一 个 字 节 的 信息 。 
一 个 操作 数 ( 如 char 型 int 型 .float 型 .double 型 ) 可 能 是 8 位 、16 位 、32 位 或 64 位 等 , 因 
此 ,可 能 占用 1 个 .2 个 .4 个 或 8 个 主 存单 元 。 也 就 是 说 ,一 个 操作 数 可 能 有 多 个 主 存 地 址 
对 应 ,在 指令 中 给 出 哪个 地 址 呢 ? 

有 两 种 不 同 的 地 址 指定 方式 : 大 端 方 式 和 小 端 方式 。 大 端 方 式 下 ,指令 中 给 出 的 地 址 
是 操作 数 最 高 有 效 字 节 所 在 的 地 址 。 小 端 方式 下 ,指令 中 给 出 的 地 址 是 操作 数 最 低 有 效 字 
节 所 在 的 地 址 。 

7. 地 址 码 位 数 与 主 存 地 址 空间 大 小 和 编 址 单位 的 关系 是 什么 ? 

答 : 指令 中 的 地 址 码 如 果 是 主 存单 元 的 地 址 ,那么 ,地 址 码 的 位 数 与 主 存 地 址 空间 大 小 
和 编 址 单位 的 长 度 有 关 。 编 址 单位 的 长 度 就 是 主 存单 元 的 宽度 ,也 就 是 最 小 的 寻 址 单位 。 
主 存 可 以 按 字 节 编 址 (8 位 ), 也 可 以 按 字 编 址 (如 16 位 ,32 位 等 )。 主 存 地 址 空间 大 小 和 编 
址 单位 确定 后 ,地 址 码 的 位 数 就 被 确定 了 。 例 如 , 若 主 存 地 址 空间 大 小 为 4GB, 编 址 单位 是 
字 节 , 则 主 存单 元 的 地 址 就 是 32 位 (4GB=2”B) ;车 按 字 (假定 一 个 字 为 32 位 ) 编 址 , 则 主 
存单 元 的 地 址 就 是 30 位 (4GB 王 22B 一 23" X4B) 。 

8， 累 加 器 型 指令 有 什么 特点 ? 

答 : 累加 器 型 指令 的 一 个 源 操作 数 和 目 操作 数 总 是 在 累加 器 中 ,是 隐 含 指定 的 ,所 以 指 
令 中 不 需要 给 出 累加 器 的 编号 。 因 而 ,累加 器 型 指令 的 指令 字 相对 来 说 较 短 , 但 由 于 每 次 运 
算 结果 都 只 能 放 到 累加 器 中 ,所 以 可 能 会 增加 一 些 从 累加 器 取 数 的 指令 而 使 程序 变 长 。 

9. 堆栈 型 指令 有 什么 特点 ? 

答 : 与 堆栈 有 关 的 操作 有 人 栈 (PUSH)、 出 栈 (POP) 和 运算 类 操作 。 运 算 类 指令 分 单 
目 运算 和 双 目 运算 ,运算 时 总 是 从 栈 顶 取 操作 数 ,运算 后 的 结果 自动 放 到 栈 顶 。 所 以 ,指令 
中 不 需要 给 出 操作 数 地 址 。 因 此 ,堆栈 指令 是 零 地 址 指令 ,指令 字 较 短 。 但 因为 所 有 的 操作 
数 都 只 能 在 栈 顶 ,所 以 ,会 增加 很 多 人 栈 指令 而 使 得 程序 变 长 。 

堆栈 指令 的 访 存 次 数 ,取决 于 采用 的 是 软 堆栈 还 是 硬 堆栈 。 如 果 是 软 堆栈 (堆栈 区 由 主 
存 实现 ) 的 话 , 对 于 双 目 运算 ,需要 访 存 4 次 : 取 指令 、 取 源 操作 数 1、 取 源 操作 数 2、 存 结果 。 
如 果 是 硬 堆栈 (堆栈 区 由 寄存 器 实现 ) , 则 只 需 取 指令 时 访问 一 次 内 存 。 

10. 通用 寄存 器 型 指令 有 什么 特点 ? 

答 : 通用 寄存 器 型 指令 是 相对 于 累加 器 型 指令 和 堆栈 型 指令 面 言 的 ,指令 中 的 操作 数 
和 运算 的 结果 既 不 是 隐 含 在 累加 器 中 ,也 不 是 隐 含 在 堆栈 中 ,而 是 在 CPU 中 提供 了 多 个 通 
用 寄存 器 ,操作 数 和 结果 可 以 放 在 这 些 寄存 器 中 ,指令 必须 明显 地 指出 操作 数 和 结果 在 哪个 
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寄存 器 或 哪个 主 存单 元 中 ,要 给 出 寄存 器 的 编号 或 主 存单 元 地 址 。 目 前 大 多 数 指令 系统 采 
用 通用 寄存 器 型 指令 风格 。 

11， 装 入 /存储 型 指令 有 什么 特点 ? 

答 : 装 人 /存储 型 指令 是 用 在 规整 型 指令 系统 中 的 一 种 通用 寄存 器 型 风格 指令 。 为 了 
规整 指令 格式 ,使 指令 具有 相同 的 长 度 ,规定 只 有 装 人 /存储 (Load/Store) 指 令 才能 访问 内 
存 , 而 运算 指令 不 能 直接 访问 内 存 , 只 能 从 寄存 器 取 数 进行 运算 ,运算 的 结果 也 只 能 送 到 寄 
存 器 。 因 为 ,寄存 器 编号 较 短 ,而 主 存 地 址 位 数 较 长 ,通过 某 种 方式 可 以 使 运算 指令 和 访 存 
指令 的 长 度 一 致 。 

这 种 装 人 /存储 型 风格 的 指令 系统 最 大 的 特点 是 指令 格式 规整 ,指令 长 度 一 致 ,一 般 为 
32 位 。 由 于 只 有 Load/Store 指令 才能 访问 内 存 , 程 序 中 可 能 会 包含 许多 装 人 指令 和 存储 
指令 ,与 一 般 通 用 寄存 器 型 风格 指令 相 比 ,其 程序 长 度 会 更 长 。 

12， 指 令 寻 址 方式 和 数据 寻 址 方式 有 什么 不 同 ? 

答 : 程序 被 启动 时 ,程序 所 包含 的 指令 和 数据 都 被 装 人 内 存 中 。 在 程序 中 的 指令 过 程 
中 ,需要 取 指 令 和 操作 数 ,确定 指令 存放 位 置 的 过 程 称 为 指令 寻 址 ,确定 操作 数 存 放 位 置 的 
过 程 称 为 数据 寻 址 。 指 令 寻 址 和 数据 寻 址 其 复杂 度 是 不 一 样 的 。 

指令 寻 址 : 指令 基本 上 按 执行 顺序 存放 在 主 存 中 ,执行 过 程 中 ,指令 总 是 从 主 存单 元 被 
取 到 指令 寄存 器 IR 中 。 顺 序 执行 时 ,用 指令 计数 器 PC 加 “1” 来 得 到 下 一 条 指令 的 地 址 ; 跳 
转 执 行 时 ,通过 转移 指令 的 寻 址 方式 ,计算 出 目标 地 址 , 送 到 PC 中 即 可 。 目 标 转移 地 址 的 
形成 方式 主要 有 3 种 : 立即 寻 址 (直接 地 址 ) 、 相 对 寻 址 (相对 地 址 ) 和 间接 寻 址 (间接 地 址 》。 

数据 寻 址 : 开始 时 ,数据 被 存放 在 主 存 中 ,但 在 指令 执行 过 程 中 , 主 存 数据 可 能 被 装 和 人 
CPU 的 寄存 器 中 ,或 者 寄存 器 数据 被 装 人 主 存 的 堆栈 区 中 :还 有 的 操作 数 可 能 是 IO 端口 
中 的 内 容 , 或 本 身 就 包含 在 指令 中 ( 即 立 即 数 )。 另 外 ,运行 的 结果 也 可 能 要 被 送 到 CPU 的 
寄存 器 .堆栈 .IO 端口 或 主 存 单元 中 ,所 以 ,数据 的 寻 址 要 涉及 对 寄存 器 、 主 存单 元 堆栈 、 
I/O 端口 和 立即 数 的 访问 。 此 外 ,操作 数 可 能 是 某 个 一 维 或 多 维 数组 的 元 素 ,因此 ,还 要 考 
虑 如 何 提供 相应 的 寻 址 方式 ,以 方便 地 在 主 存 中 找到 数组 元 素 。 综 上 所 述 ,数据 的 寻 址 比 指 
令 的 寻 址 要 复杂 得 多 。 

13. 如 何 指定 指令 的 寻 址 方式 ? 

答 : CPU 根据 指令 约定 的 寻 址 方式 对 地 址 码 的 有 关 信 息 进行 解释 ,以 找到 下 条 要 执行 
的 指令 ,或 指令 所 需要 的 操作 数 。 有 的 指令 设置 专门 的 寻 址 方式 字段 , 显 式 说 明 采 用 何 种 寻 
址 方式 ,有 的 指令 通过 操作 码 隐 含 确定 寻 址 方式 。 

规整 型 指令 一 般 在 一 条 指令 中 只 包含 一 种 寻 址 方式 ,这 样 , 就 可 在 指令 操作 码 中 隐 含 寻 
址 方式 ,不 需要 有 专门 的 寻 址 方式 字段 。 但 是 ,对 于 不 规整 型 指令 ,一 条 指令 中 的 若干 操作 
数 可 能 存放 在 不 同 的 地 方 ,因而 每 个 操作 数 可 能 有 各 自 的 寻 址 方式 字段 。 

14. 指令 的 操作 数 可 能 存放 在 机 器 的 哪些 地 方 ? 

答 : 指令 的 操作 数 可 能 存放 在 主 存 单元 、 寄 存 器 、 堆 栈 、I/O 端口 中 或 直接 存在 于 指令 
本 身 。(1) 主 存单 元 。 指 令 必 须 以 某 种 方式 给 出 所 在 单元 的 地 址 。 又 可 分 为 以 下 几 种 情况 : 
对 单个 独立 的 操作 数 进 行 处 理 ; 对 一 个 数组 中 的 若干 个 连续 元 素 或 一 个 数组 元 素 进行 处 理 ， 
对 一 个 表格 或 表格 中 的 某 个 元 素 进行 处 理 ,等 等 。 对 于 这 些 不 同 的 情况 需要 提供 不 同 的 寻 
址 方式 进行 操作 数 的 访问 。(2) 寄 存 器 。 指 令 中 只 要 直接 给 出 寄存 器 的 编号 即 可 。(3) 堆 栈 
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区 。 若 有 专门 的 堆栈 指令 , 则 指令 中 不 需要 给 出 操作 数 的 地 址 ,数据 的 地 址 隐 含 地 由 堆栈 指 
针 给 出 。(4)I/O 端口 。 当 某 个 I/O 接口 中 的 寄存 器 内 容 要 和 CPU 中 的 寄存 器 内 容 交换 
时 ,要 用 IO 指令 ,在 MO 传送 指令 中 , 需 提供 I/O 端口 号 。(5) 指 令 中 的 立即 数 。 此 时 , 操 
作 数 是 指令 的 一 部 分 ,直接 从 指令 中 的 立即 数字 段 取 操 作 数 。 

15， 有 哪些 常用 的 数据 寻 址 方式 ? 

答 : 数据 寻 址 方式 可 以 归 为 以 下 几 类 。(1) 立 即 寻 址 。 指 令 中 的 立即 数字 段 ,可 以 作为 
操作 数 , 也 可 以 作为 直接 转移 地 址 。 取 到 ALU 运算 前 ,可 能 要 对 其 进行 扩展 。(2) 直 接 寻 
址 类 。 指 令 中 直接 给 出 操作 数 所 在 的 寄存 器 编号 .I/O 端口 号 或 主 存单 元 地 址 。 如 直接 寻 
址 方式 、 寄 存 器 寻 址 方式 。(3) 间 接 寻 址 类 。 操 作 数 在 主 存单 元 中 ,而 操作 数 的 地 址 存放 在 
寄存 器 或 另 一 个 主 存单 元 中 ,指令 中 给 出 操作 数 的 地 址 所 在 的 寄存 器 编号 或 主 存单 元 地 址 。 
如 间接 寻 址 方式 .寄存 器 间接 寻 址 方式 。(4)? 偏 移 寻 址 类 。 指 令 通过 某 种 方式 给 出 一 个 形式 
地 址 和 一 个 基地 址 (在 某 个 寄存 器 中 ) ,经 过 相应 的 计算 (基地 址 加 形式 地 址 得 到 操作 数 所 
在 单元 的 地 址 。 有 变 址 、 相 对 和 基 址 寻 址 3 种 方式 。 

16, 直接 寻 址 的 操作 数 需 要 几 次 访 存 ? 

答 : 一 次 。 只 要 根据 指令 中 给 出 的 直接 地 址 进行 一 次 存储 访问 ,取出 来 的 就 是 操作 数 。 

17， 间接 导 址 的 操作 数 需要 几 次 访 存 ? 

答 : 至 少 两 次 。 先 根据 指令 中 给 出 的 间接 地 址 进行 一 次 存储 访问 ,取出 来 的 是 操作 数 
的 地 址 * 再 根据 操作 数 的 地 址 访 存 一 次 ,取出 来 的 才 是 操作 数 。 所 以 ,一 共 两 次 访 存 。 如 果 
是 多 级 间接 地 址 , 则 要 多 次 访 存 。 

18， 寄存 器 寻 址 的 操作 数 需要 几 次 访 存 ? 

答 : 不 需要 访 存 。 从 指定 寄存 器 中 取出 的 就 是 操作 数 。 

19. 寄存 器 间接 寻 址 的 操作 数 需要 几 次 访 存 ? 

答 : 一 次 。 先 从 指令 给 出 的 寄存 器 中 取出 操作 数 地 址 ,再 根据 操作 数 地 址 访 存 一 次 ,得 
到 的 就 是 操作 数 。 

20， 什么 是 变 址 寻 址 方式 ? 

答 : 变 址 寻 址 方式 下 ,指令 中 的 地 址 码 给 出 一 个 形式 地 址 ,并 且 隐 含 或 明显 地 指定 一 个 
寄存 器 作为 变 址 寄存 器 , 变 址 寄存 器 的 内 容 ( 变 址 值 ) 和 形式 地 址 相 加 ,得 到 操作 数 的 有 效 地 
址 ,根据 有 效 地 址 进行 存储 访问 ,去 取 操 作 数 或 写 运算 结果 。 

变 址 寻 址 方式 的 应 用 很 广泛 。 最 基本 的 使 用 场合 是 用 在 对 数组 元 素 的 访问 中 。 指 令 将 
数组 的 首 地 址 指定 为 形式 地 址 , 变 址 寄存 器 的 内 容 是 数组 元 素 的 下 标 , 随 着 下 标的 变化 ,可 
以 访问 数组 中 不 同 的 元 素 。 所 以 变 址 寄存 器 的 内 容 是 变化 的 ,反映 的 是 所 访问 的 数据 到 数 
组 首 地 址 的 距离 , 称 为 变 址 值 。 这 种 应 用 场合 下 ,形式 地 址 的 位 数 较 长 ,而 变 址 值 位 数 少 。 
变 址 寻 址 方式 的 指令 一 般 包含 在 一 个 循环 体内 。 每 次 进入 循环 时 , 变 址 值 都 增加 或 减少 一 
个 定 长 值 , 这 个 定 长 值 等 于 数组 元 素 的 长 度 。 

21, 什么 是 基 址 寻 址 方式 ? 

答 : 基 址 寻 址 方式 下 ,指令 中 的 地 址 码 给 出 一 个 形式 地 址 ,作为 位 移 量 ,并 且 隐 含 或 明 
显 地 指定 一 个 寄存 器 作为 基 址 寄存 器 , 基 址 寄存 器 的 内 容 和 形式 地 址 相 加 ,得 到 操作 数 的 有 
效 地 址 ,根据 有 效 地 址 进行 访 存 ,去 取 操 作 数 或 写 运 算 结果 。 
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基 址 寻 址 的 典型 应 用 有 两 个 : 一 个 是 程序 重 定 位 。 在 多 道 程 序 运行 的 系统 中 ,每 个 用 
户 程序 在 一 个 逻辑 地 址 空间 里 编写 程序 。 装 人 计算 机 运行 时 ,由 操作 系统 给 用 户 程序 分 配 
主 存 空间 ,每 个 用 户 程序 有 一 个 基地 址 ,存放 在 基 址 寄存 器 中 ,在 程序 执行 时 ,通过 基 址 寄存 
器 的 值 加 上 指令 中 的 形式 地 址 就 可 以 形成 实际 的 主 存单 元 地 址 。 第 二 个 应 用 是 扩展 指令 的 
寻 址 空间 。 即 在 运行 时 将 某 个 主 存 区 间 的 首 地 址 或 程序 段 的 首 地 址 装 人 基 址 寄存 器 ,而 形 
式 地 址 给 出 要 访问 的 单元 相对 于 该 首 地 址 的 距离 ( 即 偏 移 量 ), 因 此 指令 中 只 要 用 较 短 的 地 
址 码 来 表示 偏 移 量 。 访 问 操作 数 时 ,用 基 址 寄存 器 的 值 和 偏 移 量 相 加 ,得 到 操作 数 的 有 效 地 
址 。 只 要 基 址 寄存 器 的 内 容 更 改 到 另外 一 个 地 址 , 则 操作 数 的 地 址 空间 就 移 到 另 一 个 存储 
区 间 。 因 而 可 以 访问 到 整个 地 址 空间 ,以 实现 短 地 址 访问 大 空间 的 目的 。 

22， 变 址 寻 址 方式 和 基 址 寻 址 的 区 别 是 什么 ? 

答 : 变 址 寻 址 方式 和 基 址 寻 址 方式 的 有 效 地 址 形成 过 程 类 似 。 但 是 , 基 址 寻 址 方式 与 
变 址 寻 址 方式 在 以 下 方面 不 同 :(1) 具 体 应 用 的 场合 不 同 。 变 址 寻 址 面向 用 户 , 可 用 于 访问 
字符 串 、 数 组 表格 等 成 批 数 据 或 其 中 的 某 些 元 素 。 基 址 寻 址 面向 系统 ,用 于 解决 程序 的 重 
定位 问题 和 短 地 址 访问 大 空间 的 问题 。(2) 使 用 方式 不 同 。 变 址 寻 址 时 ,指令 中 提供 的 形式 
地 址 是 一 个 基准 地 址 ,位 移 量 由 变 址 寄存 器 给 出 ;而 基 址 寻 址 时 ,指令 中 给 出 的 形式 地 址 为 
位 移 量 , 而 基 址 寄存 器 中 存放 的 是 基准 地 址 。 不 过 ,这 里 所 讲 的 使 用 方式 并 不 是 绝对 的 ,在 
实际 的 计算 机 设计 中 ,可 能 会 有 不 同 的 应 用 场合 和 使 用 方式 。 

23， 什么 是 相对 寻 址 方式 ? 

答 : 指令 中 的 形式 地 址 给 出 一 个 位 移 量 DD, 而 基准 地 址 由 程序 计数 器 PC 提供 。 位 移 量 
给 出 的 是 相对 于 当前 指令 所 在 存储 单元 的 距离 ,位移 量 可 正 可 负 。 也 就 是 说 , 需 访问 的 信息 
可 以 在 当前 指令 之 前 的 D 个 单元 处 ,也 可 以 在 当前 指令 之 后 的 D 个 单元 处 。 

24， 相 对 寻 址 方式 用 在 哪些 场合 ? 

答 : 相对 寻 址 方式 用 在 以 下 两 种 场合 。(1) 公 共 子 程序 的 浮动 。 因 为 公共 子 程序 可 能 
被 许多 用 户 程序 调用 ,因而 会 随 着 用 户 程序 被 装 人 主 存 不 同 的 地 方 运行 。 为 了 让 公共 子 程 
序 能 在 不 同 的 主 存 区 正确 运行 ,一般 在 公共 子 程序 内 部 采用 相对 寻 址 方式 ,以 保证 指令 的 操 
作 数 总 在 相对 于 指令 的 距离 一 定 的 单元 内 。 这 样 ,不 管子 程序 浮动 到 哪里 ,指令 和 数据 的 相 
对 位 置 不 变 。 例 如 ,现行 指令 的 地 址 为 2000H ,指令 中 给 出 的 形式 地 址 为 05H ,说 明 操作 数 
在 当前 指令 后 面 第 05H 个 单元 处 , 即 2005H 处 。 当 程序 向 后 浮动 了 1000H', 使 当前 指令 的 
地 址 为 3000H 时 ,此 时 公共 子 程序 中 的 指令 数据 以 及 相对 位 置 都 不 变 ,指令 中 给 出 的 相对 
地 址 还 是 05H ,操作 数 还 是 应 该 在 当前 指令 后 面 的 第 05H 个 单元 处 ,所 以 应 该 在 3005H 
处 ,因此 ,指令 取 到 的 还 是 同一 个 数据 。(2) 转 移 目 标 地 址 的 寻 址 。 当 需要 转 到 当前 指令 的 
前 面 或 后 面 第 = 条 指令 执行 时 ,可 以 用 相对 寻 址 方式 。 此 时 ,得 到 的 转移 地 址 是 一 个 相对 
地 址 。 

25. 相对 寻 址 方式 中 如 何 确定 相对 位 置 ? 

答 : 相对 寻 址 方式 中 ,相对 位 置 的 确定 比较 复杂 。 必 须 注 意 两 个 方面 的 问题 : (1) 位 移 
量 的 问题 。 位 移 量 位 数 有 限 , 在 进行 有 效 地 址 计算 时 需要 扩展 。 一 般 位 移 量 用 补 码 表示 ,所 
以 应 采用 补 码 扩展 方式 ( 即 符号 扩展 方式 )。(2) 基 准 地址 问题 。 相 对 寻 址 的 基本 思路 是 把 
相对 于 当前 指令 前 面 或 者 后 面 第 ”个 单元 作为 操作 数 或 目标 转移 指令 的 地 址 。 但 在 具体 实 
现时 ,不 同 机 器 对 “当前 指令 ?的 含义 有 不 同 的 理解 。 有 的 机 器 在 计算 相对 地 址 时 ,PC 中 存 
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放 的 还 是 当前 正在 执行 的 指令 的 地 址 ,但 有 的 机 器 PC 加 “1” 的 操作 在 取 指 令 时 同时 完成 ， 
所 以 在 计算 相对 地 址 时 ,PC 中 已 经 是 下 一 条 指令 的 地 址 了 。 因 此 ,不 同 的 机 器 在 计算 相对 
地 址 时 可 能 有 一 点 细微 的 差别 。 

26. 堆栈 寻 址 方式 中 如 何 对 堆栈 进行 操作 ? 

答 : 堆栈 (stack) 是 一 块 特殊 的 存储 区 。 采 用 “先进 后 出 ”的 方式 进行 访问 。 栈 底 固 定 不 
动 , 栈 顶 浮 动 ,用 一 个 专门 的 寄存 器 (SP) 来 作为 栈 顶 指针 。 从 堆栈 生长 的 方向 来 分 ,可 以 有 
“ 自 顶 向 下 ”和 “ 自 底 向 上 ”两 种 堆栈 ,它们 在 进 、 出 栈 时 对 栈 指针 的 修改 是 不 同 的 。 若 每 个 栈 
中 的 元 素 只 占 一 个 主 存单 元 , 则 修改 指针 时 ,通过 “十 1” 或 “一 1” 实 现 ; 若 占 多 个 主 存 单元 , 则 
应 该 加 上 或 减 去 相应 的 值 。 

假定 栈 指针 指向 的 总 是 栈 顶 处 非 空 元 素 , 则 应 该 按 以 下 方式 修改 栈 指 针 。 对 于 “ 自 底 向 
上 ”生成 的 堆栈 , 进 栈 时 先 修改 栈 指针 : (SP) 十 1->SP, 然 后 再 压 人 数据 ;出 栈 时 先 将 数据 弹 
出 ,然后 再 修改 栈 指针 : (SP) 一 1 一 SP。 对 于 “ 自 顶 向 下 ”生成 的 堆栈 , 进 栈 时 先 修改 栈 指 
针 : (SP) 一 1-~SP, 然 后 再 压 人 数据 ;出 栈 时 先 将 数据 弹出 ,然后 再 修改 栈 指针 : (SP) 十 
1->SP。 

假定 栈 指针 指向 的 总 是 栈 顶 处 的 空 元 素 , 则 应 该 按 以 下 方式 修改 栈 指针 。 对 于 “ 自 底 向 
上 ?生成 的 堆栈 , 进 栈 时 先 压 人 数据 ,然后 再 修改 栈 指 针 : (SP) 十 1->SP; 出 栈 时 先 修改 栈 指 
针 : SP) 一 1>SP, 然 后 再 将 数据 弹出 。 对 于 “ 自 顶 向 下 ”生成 的 堆栈 , 进 栈 时 先 压 人 数据 ， 
然后 再 修改 栈 指针 : (SP) 一 1 一 SP; 出 栈 时 先 修改 栈 指针 :(SP) 十 1 一 SP, 然 后 再 将 数据 
弹出 。 

27. 返回 指令 要 不 要 有 地 址 字段 ? 

答 : 不 一 定 。 子 程序 的 最 后 一 条 指令 一 定 是 返回 指令 。 一 般 返 回 地 址 保存 在 堆栈 中 ， 
所 以 返回 指令 中 不 需要 明显 给 出 返回 地 址 ,直接 从 栈 顶 取 地 址 作为 返回 地 址 。 如 果 有 些 计 
算 机 不 使 用 堆栈 保存 返回 地 址 ,而 是 存放 到 其 他 不 确定 的 地 方 , 则 返回 指令 中 必须 有 一 个 地 
址 码 ,用 来 指出 返回 地 址 或 指出 返回 地 址 的 存放 位 置 。 

28， 转移 指令 和 转子 (调用 ) 指 令 的 区 别 是 什么 ? 

答 : 转移 指令 有 无 条 件 转移 指令 和 条 件 转移 指令 (也 叫 分 支 指令 ) 。 这 种 转移 指令 用 于 
改变 程序 执行 的 顺序 ,转移 后 不 再 返回 来 执行 ,所 以 无 须 保存 返回 地 址 。 而 转子 指令 是 一 种 
子 程序 调用 指令 , 子 程序 执行 结束 时 ,必须 返回 到 转子 指令 后 面 的 指令 执行 。 所 以 转子 指令 
执行 时 ,除了 和 转移 指令 一 样 要 计算 跳 转 的 目标 地 址 外 ,还 要 保存 返回 地 址 。 一 般 将 转子 指 
令 后 面 那 条 指令 的 地 址 作为 返回 地 址 保存 到 一 个 特殊 的 寄存 器 或 堆栈 中 。 


5.5 单项 选择 题 


1. 寄存 器 中 的 值 有 时 是 地 址 ,有 时 是 数据 ,它们 在 形式 上 没有 差别 ,只 有 通过 ( 。”) 才 
能 识别 它 是 数据 还 是 地 址 。 
A. 寄存 器 编号 B. 判断 程序 
C. 指令 操作 码 或 寻 址 方式 位 D. 时 序 信号 
2. 单 地 址 双 目 运算 类 指令 中 , 除 地 址 码 指 明 的 一 个 操作 数 以 外 , 另 一 个 操作 数 通常 采 


六 个 和 的。 


用 (  )。 
A. 堆栈 寻 址 方式 B. 立即 寻 址 方式 
C. 间接 寻 址 方式 D. 隐 含 指定 方式 
3. 某 计 算 机 为 定 长 指令 字 结构 ,采用 扩展 操作 码 编码 方式 ,指令 长 度 为 16 位 ,每 个 地 
址 码 占 4 位 ,三 地 址 指令 15 条 ,二 地 址 指令 8 条 ,一 地 址 指令 127 条 , 则 剩 下 的 零 地 址 指令 


最 多 有 ( ”) 条 .。 
A. 15 B. 16 C. 31 D. 32 
4. 在 计算 机 系统 中 ,描述 系统 运行 状态 的 部 件 是 (。 )。 
A. 程序 计数 器 B， 累 加 器 
C. 通用 寄存 器 D. 程序 状态 字 寄 存 器 


5. 下列 有 关 标志 寄存 器 的 叙述 中 ,错误 的 是 ( ”)。 
A. 可 用 它 来 存放 执行 指令 得 到 的 各 种 标志 信息 
B. 可 通过 指令 直接 访问 标志 寄存 器 并 修改 其 值 
C. 条 件 转 移 指令 根据 其 中 的 标志 位 确定 PC 的 值 
D. 不 需 像 通用 寄存 器 那样 对 标志 寄存 器 进行 编号 
6. 以 下 给 出 的 4 种 指令 类 型 中 ,执行 时 间 最 长 的 指令 类 型 是 (  )。 
A. RR 型 B. RS 型 C. SS 型 D. RI 型 
7. 假定 指令 地 址 码 给 出 的 是 操作 数 的 存储 地 址 , 则 该 操作 数 采用 的 是 ( ) 寻 址 
方式 。 


A. 立即 B. 直接 C. 基 址 D. 相对 
8. 假定 指令 地 址 码 给 出 的 是 操作 数 本 身 , 则 该 操作 数 采 用 的 是 ( ”) 寻 址 方式 。 
A, 立即 B. 直接 C. 基 址 D. 相对 


9. 假定 指令 地 址 码 给 出 的 是 操作 数 所 在 的 寄存 器 的 编号 , 则 该 操作 数 采 用 的 是 ( 。 ) 
寻 址 方式 。 


A. 直接 B. 间接 
C. 寄存 器 直接 D. 寄存 器 间接 
10. 寄存 器 间接 寻 址 方式 的 操作 数 存放 在 ( 中 。 
A. 通用 寄存 器 B. 存储 单元 
C. 程序 计数 器 D. 堆栈 
11. 车 指令 地 址 码 为 D, 则 相对 寻 址 方式 下 操作 数 的 有 效 地 址 为 (  )。 
A. D B.M[D] C. RLD] D. PC+D 
12. 车 变 址 寄存 器 编号 为 X, 形 式 地 址 为 D, 则 变 址 寻 址 方式 的 有 效 地 址 为 (。” “)。 
A. RLX] 十 D B. RLX]+R[LD] 
C. MLRLX] 十 D] D. MLRLX] 十 MLD]] 


13， 假定 采用 相对 寻 址 方式 的 转移 指令 占 两 个 字 节 ,第 一 字 节 是 操作 码 , 第 二 字 节 是 相 
对 位 移 量 (用 补 码 表示 )。 取 指令 时 ,每 次 CPU 从 存储 器 取出 一 个 字 节 ,并 自动 完成 PC 加 1 
的 操作 。 假 设 执 行 到 某 转移 指令 时 ( 即 取 指 令 前 )PC 的 内 容 为 200CH, 该 指令 的 转移 目标 
地 址 为 IFBOH , 则 该 转移 指令 第 二 字 节 的 内 容 应 为 ( )。 
A. 5CH B. 5EH C. A2H D. A4H 


计算 夫 组 成 与 系统 结 欧 习 症 解答 与 才学 指导 


14. 假设 某 指 令 的 一 个 操作 数 采用 变 址 寻 址 方式 , 变 址 寄存 器 中 的 值 为 124 ,指令 中 给 
| 出 的 形式 地 址 为 B000H, 地 址 B900H 中 的 内 容 为 C000H, 则 该 操作 数 的 有 效 地 址 为 
二 
A. B124H B. C124H C. B07CH D. CO7CH 
15. 假设 某 计算 机 采用 小 端 方式 存储 , 按 字 节 编 址 。 一 维 数组 a 有 100 个 元 素 ,其 类 型 
为 float ,存放 在 地 址 C000 1000H 开始 的 连续 区 域 中 , 则 最 后 一 个 数组 元 素 的 MSB 所 在 的 


地 址 应 为 (  )。 
A. C000 1396H B. C000 1399H 
C. C000 118CH D. C000 118FH 


16. 假设 某 条 指令 的 一 个 操作 数 采 用 一 次 间接 寻 址 方式 ,指令 中 给 出 的 地 址 码 为 
1200H, 地 址 1200H 中 的 内 容 为 12FCH, 地 址 12FCH 中 的 内 容 为 38B8H, 地 址 38B8H 中 
的 内 容 为 88F9H , 则 该 操作 数 的 有 效 地 址 为 ( )。 

A. 1200H B. 12FCH C. 38B8H D. 88F9H 

17. 假设 某 条 指令 的 一 个 操作 数 采 用 寄存 器 间接 寻 址 方式 ,假定 指令 中 给 出 的 寄存 器 
编号 为 8,8 号 寄存 器 的 内 容 为 1200H, 地 址 1200H 中 的 内 容 为 12FCH, 地 址 12FCH 中 的 
内 容 为 38B8H ,地 址 38B8H 中 的 内 容 为 88F9H , 则 该 操作 数 的 有 效 地 址 为 ( ” )。 

A. 1200H B. 12FCH C. 38B8H D. 88F9H 

18. 某 计 算 机 按 字 节 编 址 ,采用 大 端 方式 存储 信息 。 其 中 , 某 指令 的 一 个 操作 数 的 机 器 
数 为 ABCD 00FFH ,该 操作 数 采 用 基 址 寻 址 方式 ,指令 中 形式 地 址 (用 补 码 表示 ) 为 
FF00H ,当前 基 址 寄存 器 的 内 容 为 C000 0000H , 则 该 操作 数 的 LSB( 即 FFH) 存 放 的 地 址 是 
( pb 

A. C000 FFOOH B. C000 FF03H 
C. BFFF FFOOH D. BFFF FF03H 

19. 某 计 算 机 按 字 节 编 址 ,采用 小 端 方 式 存 储 信息 。 其 中 , 某 指令 的 一 个 操作 数 为 16 
位 ,该 操作 数 采用 基 址 寻 址 方式 ,指令 中 形式 地 址 (用 补 码 表示 ) 为 FF00H ,当前 基 址 寄存 器 
的 内 容 为 C000 0000H, 则 该 操作 数 的 LSB 存放 的 地 址 是 (  )。 

A.C000 FFOOH B. C000 FFO1H 

C. BFFF FFOOH D. BFFF FFO1H 
20. 输入 /输出 指令 的 功能 是 ( ) 。 

A. 在 主 存 与 CPU 之 间 进 行 数据 传送 

B. 在 主 存 和 I/O 端口 之 间 进 行 数据 传送 

C. 在 CPU 和 I/O 端口 之 间 进 行 数据 传送 

D. 在 1/O 端口 和 I/O 端口 之 间 进 行 数据 传送 

21. 通常 将 在 部 件 之 间 进 行 数据 传送 的 指令 称 为 传送 指令 。 以 下 有 关 各 类 传送 指令 功 
能 的 叙述 中 ,错误 的 是 (  €)。 

A. 出 /人 栈 指令 (Push/Pop) 完 成 CPU 和 栈 顶 之 间 的 数据 传送 
B. 访 存 指令 (Load/Store) 完 成 CPU 和 存储 单元 之 间 的 数据 传送 
C. LI/O 指令 (In/Out) 完 成 CPU 和 I/O 端口 之 间 的 数据 传送 

D. 寄存 器 传送 指令 (Move) 完 成 CPU 和 寄存 器 之 间 的 数据 传送 


22. 下 列 有 关 RISC 特征 的 描述 中 ,错误 的 是 ( )。 
A. 指令 格式 规整 , 寻 址 方式 少 
B. 采用 硬 连 线 控制 和 指令 流水 线 
C. 配置 的 通用 寄存 器 数目 不 多 
D. 运算 类 指令 的 操作 数 不 访 存 
23. 假定 编译 器 对 C 源 程序 中 的 变量 和 MIPS 中 寄存 器 进行 了 以 下 对 应 : 变量 fg、h、 
i 和 j 分 别 分 配给 寄存 器 $s0、$sl、$s2、$s3 和 $s4, 并 将 一 条 C 赋值 语句 编译 后 生成 如 
下 汇编 代码 序列 : 
add S$t0, $sl, $s2 
add S$tl, $s3, $s4 
Sub $s0, S$t0, $tl 
请 问 这 条 C 赋值 语句 是 (  )。 
A. f=(g+i))— (ht+) B. f=(gt+j))—(h+) 
C. f=(g+h)—(i+) D. f=CGi+)— (g++h) 
24. 以 下 有 关 调 用 指令 (转子 指令 ?的 叙述 中 ,错误 的 是 (  ”)。 
A. 与 高 级 语言 源 程序 中 的 过 程 调用 相对 应 ,一 次 过 程 调用 对 应 一 条 调用 指令 
B. 指令 执行 时 必须 保留 调用 指令 随后 一 条 指令 的 地 址 作为 返回 地 址 
C. 递归 调用 时 返回 地 址 通常 保存 在 栈 中 , 非 递归 调用 时 可 保存 在 特定 寄存 器 中 
D. 指令 执行 时 将 无 条 件 转移 到 目标 地 址 处 ,转移 目标 地 址 无 须 在 指令 中 明显 给 出 
25. 栈 (CStack) 是 一 块 采用 ( ) 方 式 进行 数据 存 取 的 存储 区 ,在 大 多 数 系统 (如 
MIPS) 中 , 栈 位 于 高 端 地 址 空间 ,向 低地 址 方向 动态 增长 。 
A. 顺序 访问 B. 随机 访问 C. 先进 先 出 D. 先进 后 出 
26. 以 下 有 关 栈 (Stack) 和 栈 帧 (Stack Frame) 的 叙述 中 ,错误 的 是 ( 各 
A. 栈 区 由 若干 个 栈 帧 组 成 ,每 个 栈 帧 对 应 一 个 过 程 或 子 程序 
B，CPU 中 必须 有 一 个 专门 的 栈 指针 寄存 器 ,用 来 指示 栈 顶 位 置 
C. 访 存 指令 不 能 访问 栈 中 信息 ,必须 提供 专门 的 入 栈 和 出 栈 指令 
D. 过 程 返回 时 ,应 通过 修改 栈 指针 寄存 器 将 对 应 栈 帧 从 栈 中 退出 


【参考 答案 】 

1.C 2.D 3.B 4.D 5.B 6..C 7. B 
8. A pC 10. B 11. D 12. A 13. C 14. C 
15. D 16. B 17. A 18. D 19. C 20.C 21，D 
22.C 23.C 24. D 25. D 26. C 


5.6 分 析 应 用 题 


1. 以 下 哪 种 类 型 的 指令 执行 后 一 定 会 改变 程序 执行 顺序 ? 

条 件 转移 指令 无条件 转移 指令 、 调 用 指令 、 过 程 返回 指令 、 自 陷 指 令 \ 中 断 返 
【分 析 解 答 】 

给 出 的 几 种 指令 中 ,一 定 会 改变 程序 执行 顺序 的 指令 类 型 有 无 条 件 转 移 指令 、 过 程 调用 


加 


指令 


计算 夫 组 成 与 系统 结 欧 习题 角 各 与 塌 学 指导 


指令 、 过 程 返回 指令 、 自 陷 指 令 和 中 断 返 回 指令 。 而 条 件 转移 指令 则 在 条 件 不 满足 时 顺序 执 
行 指令 。 

2. 某 计算 机 字 长 32 位 ,CPU 中 有 32 个 32 位 通用 寄存 器 ,采用 单字 长 定 长 指令 字 格 
式 ,操作 码 占 6 位 ,其 中 还 包含 对 寻 址 方式 的 指定 。 对 于 存储 器 直接 寻 址 方式 的 RS 型 指 
令 , 能 直接 寻 址 的 最 大 地 址 空间 大 小 是 多 少 ? 对 于 采用 通用 寄存 器 作为 基 址 寄存 器 的 RS 
型 指令 , 则 能 直接 寻 址 的 最 大 地 址 空间 大 小 是 多 少 ? 

【分 析 解 答 】 

因为 有 32 个 通用 寄存 器 ,所 以 寄存 器 编号 为 5 位 。 存 储 器 直接 寻 址 的 RS 型 指令 的 一 
个 操作 数 在 寄存 器 中 ,所 以 指令 中 有 一 个 5 位 的 寄存 器 编号 ,另外 一 个 地 址 码 是 直接 地 址 ， 
共有 32 一 6 一 5= 王 21 位 。 所 以 ,能 直接 寻 址 的 最 大 地 址 空间 大 小 是 22 个 字 。 

基 址 寻 址 的 RS 型 指令 的 一 个 操作 数 在 寄存 器 中 , 另 一 个 操作 数 在 基 址 寻 址 的 主 存单 
元 中 ,因为 采用 通用 寄存 器 作为 基 址 寄存 器 ,所 以 必须 在 指令 中 明显 指出 基 址 寄存 器 是 哪个 
通用 寄存 器 ,所 以 基 址 寄存 器 的 编号 占 5 位 , 剩 下 的 位 数 (32 一 6 一 5 一 5 二 16 位 ?是 位 移 量 。 
通用 寄存 器 的 位 数 是 32 位 ,所 以 基 址 寄存 器 中 的 基准 地 址 位 数 是 32 位 。 一 个 32 位 的 数 加 
上 一 个 6 位 的 数 ,其 结果 还 是 一 个 32 位 的 数 。 所 以 ,能 直接 寻 址 的 最 大 地 址 空间 大 小 是 2 
个 字 。 

3. 车 采用 相对 寻 址 方式 的 转移 指令 占 两 个 字 节 ,第 一 字 节 是 操作 码 , 第 二 字 节 是 相对 
位 移 量 (用 补 码 表示 )。CPU 在 执行 指令 时 ,每 次 从 存储 器 取出 一 个 字 节 ,并 自动 完成 PC 
加 1。 假设 某 转移 指令 的 地 址 为 200AH ,如 果 其 转移 目标 地 址 为 2000H, 则 该 转移 指令 第 
二 字 节 的 内 容 应 为 多 少 ? 

【分 析 解 答 】 

该 转移 指令 的 地 址 为 200AH, 因 此 ,在 CPU 取 指 令 过 程 中 ,取出 第 一 字 节 的 操作 码 后 ， 
PC 的 内 容 为 200BH ,取出 第 二 字 节 的 位 移 量 后 ,PC 的 内 容 为 200CH, 因 此 ,在 执行 该 转移 
指令 计算 转移 目标 地 址 时 ,PC 中 已 经 是 200CH 了 。 因 为 转移 目标 地 址 为 2000H, 所 以 ,此 
时 位 移 量 是 2000H 一 200CH= 一 0CH ,用 补 码 表示 为 100H 一 0CH=F4H。 

4. 某 指令 系统 的 指令 字 是 16 位 ,每 个 地 址 码 为 6 位 。 若 二 地 址 指令 15 条 ,一 地 址 指 
令 48 条 , 则 剩 下 的 零 地 址 指令 最 多 有 多少 条 ? 

【分 析 和 解答】 

操作 码 按 短 到 长 进行 扩展 编码 。 对 于 二 地 址 指令 ,两 个 地 址 码 占 12 位 , 剩 下 的 操作 码 
占 4 位 ,最 多 有 16 种 编码 ,15 条 指令 用 掉 15 种 编码 0000~~1110, 还 剩 一 种 编码 1111; 对 于 
一 地 址 指令 ,高 4 位 操作 码 一 定 是 1111, 最 低 6 位 是 一 个 地 址 码 , 剩 下 的 中 间 操 作 码 还 有 6 
位 ,最 多 可 以 有 64 种 编码 ,指令 条 数 是 48, 因 此 只 需 从 64 种 编码 中 选 48 种 作为 48 条 指令 
的 操作 码 。 可 采用 如 下 的 操作 码 编码 方案 : 1111 0 00000~1111 0 11111 ( 共 32 种 编码 )、 
1111 10 0000~1111101111 ( 共 16 种 编码 ); 对 于 零 地 址 指令 ,其 高 10 位 操作 码 的 编码 空 
间 为 1111 1 1 0000~1111111111, 因 此 ,高 10 位 共有 16 种 编码 可 用 ,再 加 上 低 6 位 的 64 
种 编码 ,一 共 可 组 合成 16X64 一 1024 种 编码 ,可 以 分 别 分 配给 1024 种 指令 。 故 剩 下 的 零 地 
址 指令 最 多 有 1024 条 。 

5. 某 计 算 机 指令 系统 采用 定 长 指令 字 格 式 ,指令 字 长 16 位 ,每 个 操作 数 的 地 址 码 长 6 
位 。 指 令 分 二 地 址 一 地 址 和 零 地 址 3 类 。 若 二 地 址 指令 有 k2 条 ,无 地 址 指令 有 k0 条 , 则 


一 地 址 指令 最 多 有 和 多少 条 ? 

【分 析 解 答 】 

设 一 地 址 指令 1 条 , 则 ((16 一 &2)X25 一 k1)X2s 二 k0, 故 &1 二 (16 一 k2) X 2 一 k0/25。 

6. 假设 某 计 算 机 按 字 节 编 址 ,采用 小 端 方式 存储 信息 。 若 某 指令 的 操作 数 为 32 位 字 ， 
采用 基 址 寻 址 方式 ,指令 中 形式 地 址 (用 补 码 表示 ) 为 B000H, 当前 基 址 寄存 器 的 内 容 为 
8000 4000 理 , 则 该 指令 的 操作 数 地 址 为 多 少 ? 若 该 操作 数 的 机 器 码 为 1234 5678H, 则 该 操 
作 数 的 4 个 字 节 12H、34H、56H 和 78H 的 存放 地 址 分 别 是 什么 ? 

【分 析 解 答 】 

可 用 两 种 方法 计算 操作 数 地 址 。 方 法 一 : 8000 4000H 十 FFFF B000H 二 7FFF F000H。 

方法 二 : B000H 二 1011 0000 0000 0000B ,形式 地 址 的 值 为 一 101 0000 0000 0000B= 
一 5000H ,所 以 操作 数 地 址 为 8000 4000H 一 5000H 王 7FFF F000H。 小 端 方式 下 ,LSB 的 地 
址 为 操作 数 地 址 , 即 书写 顺序 与 存储 顺序 相反 ,因而 12H、34H、56H 和 78H 的 存放 地 址 分 
别 是 7FFF F003H、7FFF F002H、7FFF F001H 和 7FFF F000H。 

7. 一 次 间接 寻 址 指令 中 给 出 的 地 址 码 为 2000H, 地址 为 2000H 的 存储 单元 中 的 内 容 
为 3000H ,地 址 为 3000H 的 存储 单元 的 内 容 为 4000H, 而 4000H 单元 的 内 容 为 5000H, 则 
该 操作 数 的 有 效 地 址 是 多 少 ? 该 操作 数 的 值 是 多 少 ? 

【分 析 解 答 】 

一 次 间接 寻 址 方式 的 指令 中 给 出 的 地 址 码 是 一 个 间接 地 址 , 即 操作 数 地 址 的 地 址 。 所 
以 ,操作 数 的 有 效 地 址 应 该 是 地 址 码 2000H 中 的 内 容 , 即 3000H; 有 效 地 址 所 指出 的 存储 单 
元 的 内 容 是 操作 数 本 身 , 即 4000H 是 操作 数 。 

8. 假设 地 址 为 1200H 的 存储 单元 中 的 内 容 为 120CH ,地 址 为 120CH 的 存储 单元 的 内 
容 为 38B8H ,而 38B8H 单元 的 内 容 为 88F9H。 说 明 以 下 各 情况 下 操作 数 的 有 效 地 址 和 操 
作 数 各 是 多 少 ? 

(1) 操作 数 采用 变 址 寻 址 , 变 址 寄存 器 中 的 值 为 12 ,指令 中 给 出 的 形式 地 址 为 1200H。 

(2) 操作 数 采用 一 次 间接 寻 址 ,指令 中 给 出 的 地 址 码 为 120CH。 

(3) 操作 数 采 用 寄存 器 间接 寻 址 ,指令 中 给 出 的 寄存 器 编号 为 8,8 号 寄存 器 的 内 容 
为 1200H。 

【分 析 解 答 】 

(1) 有 效 地 址 为 000CH 十 1200H 二 120CH ,操作 数 为 38B8H 。 

(2) 有 效 地 址 为 38B8H ,操作 数 为 88F9H。 

(3) 有 效 地 址 为 1200H ,操作 数 为 120CH 。 

9. 某 计 算 机 字 长 16 位 ,存储 器 存 取 宽度 为 16 位 ,CPU 中 有 8 个 16 位 通用 寄存 器 。 现 
为 该 机 设计 指令 系统 ,要 求 指令 长 度 为 字 长 的 整数 倍 ,至 少 支持 64 种 不 同 操作 ,每 个 操作 数 
都 支持 4 种 寻 址 方式 : 立即 (TD) 、 寄 存 器 直接 (R)、 寄 存 器 间接 (S) 和 变 址 (X) 寻 址 方式 。 存 
储 器 地 址 位 数 和 立即 数 均 为 16 位 ,任何 一 个 通用 寄存 器 都 可 作 变 址 寄存 器 ,支持 以 下 7 种 
二 地 址 指令 格式 (R、I、S、X 代表 上 述 4 种 寻 址 方式 ): RR 型 .RI 型 .RS 型 .RX 型 .XI 型 .SI 
型 .SS 型 。 请 设计 该 指令 系统 的 7 种 指令 格式 ,给 出 每 种 格式 的 指令 长 度 、 各 字段 所 占 位 数 
和 含义 ,并 说 明 每 种 格式 指令 的 功能 以 及 需要 的 访 存 次 数 ? 


计划 夫 组 成 与 系统 千 欧 习 症 解 各 与 才学 指导 


【分 析 解 答 】 


因为 至 多 有 64 种 操作 ,所 以 操作 码 字段 只 需要 6 位 ;有 8 个 通用 寄存 器 ,所 以 寄存 器 编 
号 至 少 占 3 位 * 寻 址 方式 有 4 种 ,所 以 寻 址 方式 位 至 少 占 2 位 ;直接 地 址 和 立即 数 都 是 16 
位 ;任何 通用 寄存 器 都 可 作 变 址 寄存 器 ,所 以 指令 中 需 明 显 指定 变 址 寄存 器 ,其 编号 占 3 位 
指令 总 位 数 是 16 的 倍数 。 此 外 ,指令 格式 应 尽量 规整 ,指令 长 度 应 尽量 短 。 按 照 上 述 这 些 
要 求 设 计 出 的 指令 格式 可 以 有 很 多 种 。 以 下 是 采用 二 地 址 指令 格式 的 两 种 指令 格式 设计 方 
案 ,RI XI 和 SI 三 种 指令 格式 中 添 了 3 个 0, 是 为 了 补足 位 数 ,以 使 指令 长 度 为 16 的 倍数 。 
这 两 种 方案 得 到 的 RR、RS 和 SS 型 指令 都 是 16 位 ,RI、RX 和 SI 型 指令 都 是 32 位 ,XI 型 指 


令 是 48 位 。 


指令 格式 示例 1: 如 图 5. 1 所 示 ,其 中 最 左边 的 4 位 为 “类 型 >? 字段 ,用 于 说 明 不 同 的 指 
令 类 型 ,这 样 ,不 用 对 两 个 操作 数 的 寻 址 方式 分 别 说 明 。7 种 指令 类 型 只 要 3 位 编码 即 可 ， 
所 以 最 后 1 位 总 是 “0”。 


RR 型 
RI 型 
RS 型 
RX 型 
XI 型 
SI 型 


SS 型 


0000 | OP(6 位 ) | Rt (3 位 ) | Rs (3 位 ) 

0010 | OP(6 位 ) | Rt (3 位 ) 000 Imm16(16 位 ) 

0100 | OP(6 位 ) | Rt G3 位 ) | Rs (3 位 ) 

0110 | OP(6 位 ) | Rt G 位 ) | Rx (3 位 ) | Offset16(16 位 ) 

1000 | OP(6 位 ) | Rx (3 位 ) | ”000 | Offset16(16 位 ) Imm16(16 位 ) 
1010 | OP(6 位 ) | RtG3 位 ) | ”000 Imm16(16 位 ) 

1100 | OP(6 位 ) | Rt (3 位 ) | Rs (3 位 ) 


图 5.1 第 一 种 指令 格式 示例 


指令 格式 示例 2: 如 图 5. 2 所 示 , 用 专门 的 “ 寻 址 方式 ”字段 分 别 说 明 两 个 操作 数 的 寻 址 
方式 。 其 定义 为 00- 立 即 、01- 寄 存 器 直接 、10- 寄 存 带 间接 、11- 变 址 。 


RR 型 


RI 型 


OP(6 位 ) | 01 | 01 | RtG3 位 ) Rs (3 位 ) 

OP(6 位 ) | 01 | 00 | RtG3 位 } 000 Imm16(16 位 ) 

OP(6 位 ) | 01 | 10 | Rt(3 位 》| Rs (3 位 ) 

OP(6 位 ) | 01 | 11 | Rt (3 位 ) | Rx (3 位 ) | Offset16(16 位 ) 

OP(6 位 ) | 11 | 00 | Rx (3 位 ) ”000 ”| Offset16(16 位 ) | Imml16(16 位 ) 
OP(6 位 ) | 10 | 00 | RtG3 位 》 000 Imm16(16 位 ) 

OP(6 位 ) | 10 | 10 | Rt (3 位 》 Rs (3 位 ) 


图 5.2 第 二 种 指令 格式 示例 


存储 器 存 取 宽度 为 16 位 ,说 明 每 次 可 从 存储 器 取出 16 位 。 因 此 , 读 取 16、32 和 48 位 
指令 分 别 需要 1、2 和 3 次 存储 器 访问 。 各 类 指令 的 功能 和 访 存 次 数 分 别 说 明 如 下 CM[z] 表 


元 


第 
5 
| 章 


示 存 储 器 地 址 x 中 的 内 容 , R[xj] 表 示 寄 存 器 x 中 的 内 容 ) 。 

RR 型 指令 的 功能 为 RLRt<RLRt] op RLRs], 访 存 1 次 ;RI 型 指令 的 功能 为 RERt] 
RLRt] op Imm16, 访 存 2 次 ;RS 型 指令 的 功能 为 RLRt]<-RLRt] op MLR[LRs]], 访 存 2 次 ; 
RX 型 指令 的 功能 为 RERt]<-R[LRt] op MLRLRxj] 十 Offset], 访 存 3 次 ;XI 型 指令 的 功能 为 
M[R[Rx] 十 Offset]<-M[R[Rx] 十 Offset] op Imm16, 访 存 5 次 ;SI 型 指令 的 功能 为 
M[LRLRt]]<-M[LRLRtj] op Imm16, 访 存 4 次 ;SS 型 指令 的 功能 为 MLRLRt]]<-M[LRLRt]] 
op M[R[LRs]], 访 存 4 次 。( 上 述 给 出 的 访 存 次 数 中 包括 读 取 指 令 过 程 中 的 访 存 次 数 ) 

10. 某 计 算 机 字 长 为 16 位 , 主 存 地 址 空间 大 小 为 128 KB, 按 字 编 址 。 采 用 单字 长 定 长 
指令 格式 ,指令 各 字段 定义 如 下 : 


15 12 11 6 5 0 
T 
OP Ms 1 Rs Md |! Rd 


源 操作 数 目的 操作 数 
转移 指令 采用 相对 寻 址 方式 ,相对 偏 移 量 用 补 码 表 示 。 寻 址 方式 定义 如 表 5. 3 所 示 。 
表 5.3 题 10 中 定义 的 寻 址 方式 及 其 含义 


wm 六 
区 RE 
010B 操作 数 二 M[RERn]], RERn]<R[Rn] 十 1 


( 注 : M[xj 表 示 存 储 器 地 址 x 中 的 内 容 ,R[x] 表 示 寄存 器 x 中 的 内 容 ) 


请 回答 下 列 问题 ， 

(1) 该 指令 系统 最 多 可 有 多 少 条 指令 ? 该 计算 机 最 多 有 多 少 个 通用 寄存 器 ? 存储 器 地 
址 寄存 器 (MAR) 和 存储 器 数据 寄存 器 (MDR) 至 少 各 需要 多 少 位 ? 

(2) 转移 指令 的 目标 地 址 范围 是 多 少 ? 

(3) 若 操作 码 0010B 表示 加 法 操作 ( 助 记 符 为 add) ,寄存 器 R4 和 R5 的 编导 分 别 为 
100B 和 101B,R4 的 内 容 为 1234H,R5 的 内 容 为 5678H, 地 址 1234H 中 的 内 容 为 5678H， 
地 址 5678H 中 的 内 容 为 1234H, 则 汇编 语句 “add (R4)，(R5) 十 ”( 逗 号 前 为 第 二 源 操 作 数 ， 
逗号 后 为 第 一 源 操 作 数 和 目的 操作 数 ) 对 应 的 机 器 码 是 什么 (用 十 六 进 制 表示 )? 该 指令 执 
行 后 ,哪些 寄存 器 和 存储 单元 的 内 容 会 改变 ? 改变 后 的 内 容 是 什么 ? 

【分 析 解 答 】 

〈1) 因为 采用 单字 长 指令 格式 ,操作 码 字 段 占 4 位 ,所 以 最 多 有 16 条 指令 ;指令 中 通用 
寄存 器 编号 占 3 位 ,所 以 ,最 多 有 8 个 通用 寄存 器 ;因为 主 存 地 址 空间 大 小 为 128KB, 按 字 编 
址 , 故 共 有 64K 个 存储 单元 ,因而 地 址 位 数 为 16 位 ,所 以 MAR 至 少 为 16 位 ;因为 字 长 为 
16 位 ,所 以 MDR 至 少 为 16 位 。 

(2) 因为 地 址 位 数 和 字 长 都 为 16 位 ,所 以 PC 和 通用 寄存 器 位 数 均 为 16 位 ,两 个 16 位 
数据 相 加 其 结果 也 为 16 位 , 即 转移 目标 地 址 位 数 为 16 位 ,因而 能 在 整个 地 址 空间 转移 , 即 
目标 转移 地 址 的 范围 为 0000H~EFFFFH。 
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| (3) 要 得 到 汇编 语句 “add (R4),(R5) 十 对 应 的 机 器 码 , 只 要 将 其 对 应 的 指令 代码 各 个 
| 字段 拼接 起 来 即 可 。 显 然 ,add 对 应 OP 字段 ,为 0010B;(R4) 的 寻 址 方式 字段 为 001B,R4 
| “的 编号 为 100B;(R5) 十 的 寻 址 方式 字段 为 010B,R5 的 编号 为 101B; 所 以 ,对 应 的 机 器 码 为 
0010 001 100 010 101B ,用 十 六 进 制 表示 为 2315H。 指 令 “add (R4)，(R5) 十 ”的 功能 为 
MLRLR5]]<-MLRLR5]] 十 MLIRLR4]],RLR5]< 一 RLR5] 十 1。 已 知 RLR4] = 1234H， 
R[R5]=5678H,M[1234H] = 5678H, M[5678H] 二 1234H, 因为 1234H 十 5678H 一 
68ACH, 所 以 5678H 单元 中 的 内 容 从 1234H 改变 为 68ACH, 同 时 R5 中 的 内 容 从 5678H 
变 为 5679H。 

11. 假定 A 是 一 个 32 位 的 地 址 ,A_upper 和 A_lower 分 别 表示 地 址 A 的 高 、 低 16 位 ， 
以 下 MIPS 指令 代码 用 来 将 存放 在 存储 器 地 址 A 处 的 机 器 码 读 人 寄存 器 $ s0 中 。 


1ui S$t0y A_upper # 将 A_upper 的 低位 添加 16 个 0, 送 $t0 

ori $t0， $t0, A lower # 将 A_lower 的 高 位 扩展 0 后 与 St0 的 内 容 相 " 或 ", 送 $t0 

1w $s0, 0($t0) # 将 St0 的 内 容 和 0 相 加 得 到 有 效 地 址 ,从 中 取 数 送 $s0 

上 述 功 能 也 能 用 以 下 两 条 MIPS 指令 来 实现 。 请 问 第 一 条 指令 中 A_upper_adjusted 
的 值 如 何 得 到 ? 


lui S$t0, A upper adjusted 
lw $s0, A lower($t0) # 将 A_lower 进行 符号 扩展 后 ,和 $t0 的 内 容 相 加 ,得 到 有 效 
# 地 址 ,从 中 取 数 送 $ s0 


【分 析 和 解答】 

因为 MIPS 指令 中 的 立即 数 只 能 是 16 位 ,所 以 一 个 32 位 的 地 址 无 法 直接 传送 到 一 个 
32 位 寄存 器 中 ,第 一 种 方案 是 通过 将 地 址 A 的 高 16 位 和 低 16 位 分 别 作 为 两 条 指令 的 立即 
数 , 将 它们 用 “或 ”操作 合并 到 一 个 32 位 寄存 器 中 。 这 样 ,第 3 条 取 数 指令 lw 的 偏 移 量 就 是 
0。 第 二 种 方案 中 取 数 指令 lw 的 偏 移 量 是 A 的 低位 部 分 A_lower, 由 于 取 数 指令 lw 在 计 
算 内 存单 元 地 址 时 对 偏 移 量 采 用 的 是 符号 扩展 ,所 以 要 使 得 高 16 位 最 终 的 结果 为 A_ 
upper, 必 须 对 A_upper 进行 以 下 调整 : 若 A_lower 的 最 高 位 (看 成 低 16 位 数 的 符号 位 ) 是 
0, 则 A_upper_adjusted 一 A_upper, 这 样 ,A_lower 符号 扩展 后 高 16 位 为 全 0, 和 高 16 位 
A_upper 相 加 后 ,高 16 位 还 是 A_upper; 若 A_lower 的 最 高 位 是 1, 则 A_lower 符号 扩展 后 
高 16 位 为 全 1, 此 时 , A_upper_adjusted 应 满足 FFFFH 十 A_upper_adjusted 一 A_upper。 
而 因为 FFFFH 十 A_upper 十 1 一 A_upper( 最 高 位 向 前 面 的 进位 被 丢弃 ) ,所 以 ,A_upper _ 
adjusted 二 A_upper 十 1。 

12. 除了 硬件 乘法 器 外 ,还 可 以 用 移 位 和 加 法 指令 来 实现 乘法 运算 。 在 乘 以 较 小 的 常 
数 时 ,这 种 办 法 很 有 效 。 在 不 考虑 溢出 的 情况 下 ,假设 要 将 $ s0 的 内 容 与 6 相 乘 ,乘积 存 人 
$ sl 中 。 请 写 出 一 段 指令 条 数 最 少 且 不 包括 乘法 指令 的 MIPS 代码 。 

【分 析 解 答 】 

一 个 数 z 乘 以 6, 相 当 于 4x 十 2zx, 而 4z 可 以 通过 将 xz 左 移 两 位 来 实现 ,2z 可 以 通过 将 
z 左 移 一 位 来 实现 。 这 样 就 只 要 用 两 条 左 移 指 令 和 一 条 加 法 指令 来 实现 乘 6 操作 。 以 此 类 
推 , 当 乘 以 一 个 较 小 的 常数 时 ,只 要 将 这 个 较 小 的 常数 分 解 成 若干 个 2 的 寡 次 相 加 ,就 可 以 
用 若干 条 左 移 指 令 和 一 条 加 法 指令 来 实现 乘法 运算 。 可 用 以 下 指令 序列 实现 题目 要 求 。 


sll $sl, $s0, 2 # 将 $s0 的 内 容 左 移 两 位 , 送 $ sl 
sll $s0, $s0, 1 # 将 $s0 的 内 容 左 移 一 位 , 送 $s0 
addu $sl, $sl, $s0 # 将 $sl 和 $s0 的 内 容 相 加 (不 考虑 溢出 ), 送 $sl 


13. 有 些 计 算 机 提供 了 专门 的 指令 ,能 从 32 位 寄存 器 中 抽取 其 中 任意 一 个 位 串 置 于 另 
一 个 寄存 器 的 低位 有 效 位 上 ,并 高 位 补 0, 如 图 5. 3 所 示 。MIPS 指令 系统 中 没有 这 样 的 指 
令 ,请 写 出 最 短 的 一 个 MIPS 指令 序列 来 实现 这 个 功能 ,要 求 i 二 5, 7 一 22, 操 作 前 后 的 寄存 
器 分 别 为 $s0 和 $s2。 


31 了 了 0 
| | 
(31 力 位 (0D) 位 (入 ]) 位 
3 1 0 
0 本 o0 | 
G2-( 广 妨 位 (位 
图 5.3 题 13 中 操作 前 后 示意 图 
【分 析 解 答 】 
可 以 先 左 移 9 位 ,然后 右 移 15 位 ,MIPS 指令 序列 为 : 
sll $s2, $s0, 9 # 将 $s0 的 内 容 左 移 9 位 , 送 $s2 
srl $s2, $s2, 15 # 将 $s2 的 内 容 右 移 15 位 , 送 $s2 


这 里 要 注意 ,第 二 条 指令 不 能 用 算术 右 移 指令 sra, 因 为 算术 右 移 高 位 添加 的 是 符号 ,所 
以 ,不 能 保证 高 位 一 定 补 0。 此 外 ,第 一 条 指令 中 的 目的 操作 数 寄存 器 和 第 二 条 指令 的 源 操 
作 数 寄存 器 都 只 能 用 $ s2 ,而 不 能 改 成 其 他 寄存 器 ,否则 ,会 破坏 其 他 寄存 器 的 值 ! 

14. 以 下 程序 段 是 某 个 过 程 对 应 的 指令 序列 。 入 口 参数 int a 和 int b 分 别 置 于 $a0 和 
$al 中 ,返回 参数 是 该 过 程 的 结果 , 置 于 $v0 中。 要 求 为 以 下 MIPS 指令 序列 加 注释 ,并 简 
单 说 明 该 过 程 的 功能 。 


add $t0, S$zero, $zero 
loop: beq $al, S$zero, finish 
add St0， S$t0, $a0 
sub $al, S$al, 1 
| loop 
finish: addi $t0, S$t0， 100 
add $vO0, S$t0, $zero 


【分 析 和 解答】 
add $t0, S$zero, S$zero # 将 寄存 器 St0 置 0 

loop: beq $al, S$zero, finish # 若 $al 的 值 等 于 0, 则 转 finish 处 
add S$t0, $t0, S$a0 # 将 $t0 和 $a0 的 内 容 相 加 , 送 $t0 
sub $al, S$al, 1 #4 将 $al 的 值 减 1 
3 loop # 无 条 件 转 到 loop 处 

finish: addi $t0, $t0, 100 # 将 $t0 的 内 容 加 100 


add S$v0O, S$t0, $zero # 将 $t0 的 内 容 送 $v0 
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该 过 程 的 功能 是 计算 “aX5b 十 100”。 

15. 用 一 条 MIPS 指令 或 最 短 的 指令 序列 实现 以 下 C 语 言语 句 : 5 二 2514a。 假 定编 译 器 
将 a 和 5 分 别 分 配 到 $ to 和 $tl 中 。 如 果 把 25 换 成 65536, 即 2 一 65536|a, 则 用 MIPS 指 
令 或 指令 序列 如 何 实现 ? 

【分 析 解 答 】 

只 要 用 一 条 指令 “ori $tl，$t0，25? 就 可 实现 8 一 25|a。 但 是 ,如 果 把 25 换 成 65536， 
则 不 能 用 一 条 指令 “ori $t1，$t0，65536” 来 实现 ,因为 65536 一 1 0000 0000 0000 0000B， 
它 不 能 用 16 位 立即 数 表 示 。 可 用 以 下 两 条 指令 实现 5 一 65536|a。 


lui $tl, 1 # 将 0001 0000H 置 于 寄存 器 $t1 

or S$tl, S$tO, $t1 # 将 $t0 和 $t1 的 内 容 进行 "或 "运算 , 送 $t1 

16. 请 说 明 beq 指令 的 跳 转 范围 ,并 解释 为 什么 汇编 程序 在 对 下 列 MIPS 汇编 源 程 序 
中 的 beq 指令 进行 汇编 时 会 遇 到 问题 ,应 该 如 何 修改 该 程序 段 ? 


here: beq $s0, $s2, there 


there: addi $sl, $s0, 4 


【分 析 解 答 】 

在 MIPS 指令 系统 中 ,分 支 指令 beq 是 I- 型 指令 ,转移 目标 地 址 采用 相对 寻 址 方式 ,16 
位 偏 移 量 offset 用 补 码 表 示 , 因 此 可 以 跳 转 到 当前 指令 前 ,也 可 以 跳 转 到 当前 指令 后 。 其 转 
移 目 标 地 址 的 计算 公式 为 PC 十 4 十 OffsetX4。 因 此 , 当 Offset 的 范围 为 0000 0000 0000 
0000B~0111 1111 1111 1111B 时 ,beq 指令 向 后 正 跳 ,相对 于 本 条 指令 ,向 后 正 跳 1~25 条 
指令 ,其 跳 转 地 址 范围 为 4 ~ 4 十 (25 一 1)X4 王 27 。 当 Offset 的 范围 为 1000 0000 0000 
0000B ~ 1111 1111 1111 1111B 时 ,beq 指令 向 前 负 跳 ,相对 于 本 条 指令 ,向 前 负 跳 1 一 
25 一 1 条 指令 ,其 跳 转 地 址 范围 为 一 4X (2 一 1)~ 一 4。 

当 上 述 指 令 序 列 中 here 和 there 表示 的 地 址 相差 超过 上 述 给 定 范围 时 ,beq 指令 会 发 
生 汇 编 错误 。 可 将 上 述 指令 序列 改 成 以 下 指令 序列 。 因 为 无 条 件 跳 转 指 令 j 的 跳 转 范围 足 
够 大 ,所 以 可 以 直接 从 here 跳 转 到 there。 


here: bne $s0, $s2, skip 
j] there 

skip: 

there: addi $sl, $s0, 4 


17. 下 列 指令 序列 对 应 一 个 完整 的 过 程 ,用 来 对 两 个 数组 进行 处 理 , 并 产生 结果 存放 在 
$ vo 中 。 假 定 每 个 数组 有 2500 个 元 素 ,每 个 数组 元 素 都 为 int 类 型 。 两 个 数组 的 首 地 址 分 
别 存 放 在 $a0 和 $al 中 ,数组 长 度 分 别 存放 在 $$ a2 和 $a3 中 。 根 据 注释 简单 说 明 该 过 程 
的 功能 。 假 定 该 过 程 运 行 在 一 个 时 钟 频率 为 2GHz 的 处 理 器 上 ,add、addi 和 sll 指令 的 CPI 
为 1;lw 和 bne 指令 的 CPI 为 2, 则 最 坏 情况 下 运行 该 过 程 所 需要 的 时 间 是 多 少 秒 ? 


sll S$a2, $a2, 2 #$a2 的 内 容 左 移 2 位 , 即 乘 4 
sll $a3, $a3, 2 #$a3 的 内 容 左 移 2 位 , 即 乘 4 


add  $Sv0， 
add $t0, 
outer: add $t4, 
lw $ta, 
add $tl, 
inner; add $t3, 
1w $t3, 
bne S$t3, 
addi $vO0, 
skip: addi $til, 
bne S$tl, 
addi $t0, 
bne $t0, 
【分 析 解 答 】 


$2zero, S$zero 
$zero, S$zero 
$a0, S$t0 
0($t4) 

$zero, $zero 
$al, $t1 
0($t3) 

$t4, Skip 
$v0, 1 

Stl， 4 

$a3, inner 
$t0, 4 


$a2, outer 


#$v0 初始 化 为 0 

#$t0 初始 化 为 0 

# 计 算数 组 1 当前 元 素 的 地 址 
# 数 组 1 当前 元 素 存放 在 $t4 
#$t1 初始 化 为 0 
# 计 算数 组 2 当前 元 素 的 地 址 

# 数 组 2 当前 元 素 存 放 在 $t3 

# 若 $t3 和 $t4 的 内 容 不 相等 , 则 转 skip 
#Sv0 加 1 

#$tl 加 4 

# 数 组 2 未 处 理 完 , 继 续 转 inner 执行 
#$t0 加 4 

# 数 组 1 未 处 理 完 , 继 续 转 outer 执行 


该 过 程 的 功能 是 统计 两 个 数组 中 相同 元 素 的 个 数 ,多 次 相等 则 重复 计数 。 最 坏 的 情况 
是 两 个 数组 的 所 有 元 素 都 相等 ,这 样 ,指令 “addi $v0，$ v0，1” 在 每 次 循环 中 都 被 执行 。 
因为 add、addi 和 sll 指令 的 CPI 为 1,lw 和 bne 指令 的 CPI 为 2, 所 以 ,在 最 坏 情 况 下 所 需要 
的 时 钟 周期 总 数 为 (4 十 [4 十 (6 十 3)X2500 十 3]X2500} 王 56267506 ,时 钟 周期 为 1/2GHz 一 
0. 5ns, 因此 ,执行 该 过 程 的 总 执行 时 间 最 多 为 56267506 X0. 5ns 一 28133753ns<“0. 028s。 

18. 以 下 程序 段 是 某 个 过 程 对 应 的 MIPS 指令 序列 ,其 功能 为 复制 一 个 存储 块 数据 到 
另 一 个 存储 块 中 ,存储 块 中 每 个 数据 的 类 型 为 float, 源 数据 块 和 目的 数据 块 的 首 地 址 分 别 
存放 在 $a0 和 $al 中 ,复制 的 数据 个 数 存放 在 $ v0 中 ,作为 返回 参数 返回 给 调用 过 程 。 在 
复制 过 程 中 遇 到 0 则 停止 ,最 后 一 个 0 也 需要 复制 ,但 不 被 计数 。 已 知 该 程序 段 中 有 多 个 


Bug, 请 找 出 它们 并 修改 。 


addi $v0, 
loop: lw $v1l, 
sw $vil, 
addi $a0, 
addi $al, 
beq S$vl, 


【分 析 解 答 】 
修改 后 的 代码 如 下 : 


addi $v0, 
loop: lw $vl, 
Sw Rly 
beq S$vl, 
addi S$a0, 
addi S$al, 
addi $v0, 
j loop 


exit: 


$zero, 0 
0($a0) 
0($al) 

$a0, 4 

$al, 4 
$zero, loop 


$zero, 0 
0($a0) 
0($al) 
$zero, exit 
$a0, 4 

$al, 4 

$v0, 1 
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19. 考虑 下 面 的 C 语言 程序 段 : 


for (i=0; i<=100; i=i+1;) 


a[li]=b[i]+c; 


假定 数组 a 和 5 的 每 个 元 素 都 是 int 型 变量 , 首 地 址 分 别 存放 在 寄存 器 $a0 和 $al 中 。 
寄存 器 $t0 和 $s0 分 别 对 应 变量 i 和 c。 要 求 写 出 与 之 对 应 的 MIPS 指令 代码 ,并 计算 这 
段 代码 运行 过 程 中 所 执行 的 指令 条 数 和 数据 的 访 存 次 数 ? 


【分 析 解 答 】 


每 个 数组 元 素 占 4 个 字 节 ,所 以 循环 体内 每 一 步 地 址 增 量 是 4。 上述 程 序 段 对 应 的 
MIPS 汇编 形式 的 指令 代码 序列 如 下 。 


add $t0, 
loop: add $t4, 
lw $t5, 
add $t6, 
add $t7, 
Sw Sb 
addi $t0, 
silti $t8, 
bne $t8, 


$2zero, S$zero #i=0 

$al, $t0 #$t4=address of b[i] 

0($t4) #$t5=b[i] 

$t5, $s0 #$t6=b[il]+c 

$a0, $t0 #$t7=address of a[il] 

0($t7) #a[li]=b[i]+c 

St0， 4 #1=i+4 

$t0, 401 #if (i<401) then $t8=1 else $t8=0 
$zero, loop #if ($t8=1) go to loop 


该 段 代码 运行 过 程 中 共 执 行 了 1 十 101X 8 二 809 条 指令 。 其 中 , 访 存 指令 条 数 为 
2X101 一 202 条 ,因此 数据 的 访 存 次 数 为 202 次 。 

20. 某 高 级 语言 源 程 序 中 的 一 个 while 语句 为 “while(save[1i] 二 二 k)i 十 = 二 1;”, 若 对 其 
编译 时 ,编译 器 将 i 和 上 分 别 分 配 在 寄存 器 $s3 和 $s5 中 ,数组 save 的 基 址 存放 在 $ s6 
中 , 则 生成 的 MIPS 汇编 代码 段 如 下 。 


loop: sll $15 
add $$tl, 
1w $tO, 
bne $t0O, 
addi $s3, 
j loop 


exit; 


$s3, 2 #R[Stl]<-RISs3]<<2, 即 RIStl]=iX4 
$t1, $s6 #R[Stl]<RIStl]+RIS$s6], 即 RIStl]=aAddress of save[i] 
0($t1) #R[IStO]<MIR[I$t1]+0] ,Bp RISt0]= save [i] 
$s5, exit #if RI[$t0] R[$s5] then goto exit 
$s3, 1 #R[$s3]<R[$s3]+1, 即 i=i+1 
#goto loop 


假设 从 loop 处 开始 的 指令 序列 存放 在 内 存 80000 处 , 则 上 述 循环 对 应 的 MIPS 机 器 码 


如 图 5.4 所 示 。 


根据 上 述 叙 述 , 回 答 下列 问 题 ,要 求 说 明理 由 或 给 出 计算 过 程 。 
C1) MIPS 的 编 址 单位 是 多 少 ? 数组 save 每 个 元 素 占 几 个 字 节 ? 
《2) 为 什么 指令 “sll $tl，$ s3，2” 能 实现 4Xi 的 功能 ? 

(3) 该 循环 指令 序列 中 哪些 是 R- 型 指令 ? 哪些 是 工 型 指令 ? 

(4) $to 和 $ s6 的 编号 各 为 多 少 ? 

(5) 指令 “4j loop” 的 操作 码 是 什么 (用 二 进 制 表示 7? 

(6) 标号 exit 的 值 是 多 少 ? 如 何 根据 指令 计算 得 到 ? 


位 
80000 0 0 19 9 不 
80004 0 9 22 9 0 32 
0 
2 
1 


80008 35 9 8 
80012 村 

80016 8 19 21 
80020 和 

80024 


20000 


图 5.4 题 20 中 程序 的 机 器 级 代码 


(7) 标号 loop 的 值 是 多 少 ? 如 何 根据 指令 计算 得 到 ? MIPS 中 跳 转 指令 的 跳 转 范围 是 
多 少 ? 

【分 析 解 答 】 

(1) MIPS 的 编 址 单位 是 字 节 。 从 图 5.4 中 可 看 出 ,每 条 指令 32 位 , 占 4 个 地 址 ,所 以 
一 个 地 址 中 有 8 位 。 因 为 每 次 循环 取 数 组 元 素 时 ,其 下 标 地 址 都 要 乘 以 4, 所 以 save 数组 的 
每 个 元 素 占 4 个 字 节 。 

(2) 因为 这 是 左 移 指令 , 左 移 2 位 ,相当 于 乘 以 至 一 4。 

(3) 从 图 5.4 可 以 看 出 ,第 1 和 第 2 条 为 R- 型 指令 ,第 3、4、5 条 为 工 型 指令 。 

(4) 从 图 5.4 中 第 3 和 第 4 条 指令 可 看 出 , $to 的 编号 为 8, 从 第 2 条 指令 可 看 出 $s6 
的 编号 为 22。 

(5) 指令 loop” 的 操作 码 为 <000010B”。 

(6) 标号 exit 的 值 是 80024, 其 含义 是 循环 结束 时 跳出 循环 后 执行 的 首 条 指令 的 地 址 。 
它 由 当前 分 支 指令 (条 件 转移 指令 ) 的 地 址 80012 加 上 4 得 到 下 条 指令 的 地 址 ,然后 再 加 上 
相对 位 移 量 2X4 得 到 , 即 80012 十 4 十 2X4 一 80024。 

(7) 标号 loop 的 值 为 80000, 是 循环 人 口 处 首 条 指令 的 地 址 ,由 跳 转 指令 的 32 位 地 址 
80020 的 高 4 位 (0000B) ,与 指令 中 给 出 的 低 26 位 (20000) 拼 接 成 30 位 地 址 ,然后 再 在 低位 
添 两 个 0( 相 当 于 义 4) 得 到 , 即 20000X4 一 80000。 因 为 跳 转 指令 的 地 址 与 其 跳 转 到 的 目标 
指令 地 址 的 高 4 位 一 样 ,所 以 ,如 果 将 4GB 的 主 存 空间 分 割 成 16 个 256MB 的 子 空间 ,那么 
跳 转 到 的 目标 指令 总 是 和 跳 转 指 令 在 同一 个 子 空 间 ,不 可 能 跳出 它 本 身 所 在 的 256MB 的 子 
空间 ,所 以 跳 转 目标 地 址 范围 的 大 小 是 256M, 即 假定 跳 转 指令 地 址 的 高 4 位 为 又 , 则 跳 转 目 
标 地 址 范围 是 X000 0000H~XFFF FFFCH。 

21. 以 下 C 语 言 程序 段 中 有 两 个 过 程 sum_array 和 compare, 假定 sum_array 第 一 个 被 
调用 ,全 局 变量 sum 分 配 在 寄存 器 $ s0 中 。 要 求 写 出 每 个 过 程 对 应 的 MIPS 汇编 表示 ,并 
说 明 每 个 过 程 对 应 的 栈 帧 中 需要 保存 的 信息 。 


int sum=0; 
int sum_array(int array[]，int num) 
{ 

int i; 

for (i=0; i <num; i++) 


if compare (num, i+1) sumt=array[i] } 


AAOoODNDPp 


return sum; 
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8 } 

9 int compare (int a, int b) 

10 { 

11 if (a >b) 

se return 1; 

13 else 

14 return 0; 

15 } 

【分 析 解 答 】 

程序 由 两 个 过 程 组 成 ,全 局 静态 变量 sum 分 配给 $ s0 ,在 过 程 调用 时 ,全 局 变量 无 顷 人 
栈 保存 。 


为 了 尽量 减少 指令 条 数 , 并 减少 访 存 次 数 ,在 每 个 过 程 的 过 程 体 中 总 是 先 使 用 临时 寄存 
器 $t0 一 $t9 ,临时 寄存 器 不 够 或 者 某 个 值 在 调用 过 程 返回 后 还 需要 用 ,就 使 用 保存 寄存 器 
$ s0~ $s7。 

MIPS 指令 系统 中 没有 寄存 器 传送 指令 ,为 了 提高 汇编 表示 的 可 读 性 ,引入 一 条 伪 指 令 
move 来 表示 寄存 器 传送 ,汇编 器 将 其 转换 为 具有 相同 功能 的 机 器 指令 。 伪 指令 “move 
$t0，$s02 对 应 的 机 器 指令 为 “add $$t0,$zero, $s0”。 

(1) 过 程 sum_array: 过 程 中 使 用 的 array 数组 在 其 他 过 程 中 已 经 定义 ,而 不 是 局 部 变 
量 , 无 须 在 过 程 的 栈 帧 中 给 它 分 配 空间 ,只 需 将 其 首 地 址 作为 人 口 参数 传递 给 过 程 
sum_array( 假 定 在 $a0 中 )。 此 外 ,还 有 另 一 个 人 口 参数 为 num( 假 定 在 $al 中 ), 最 后 有 一 
个 返回 参数 sum。 该 过 程 又 调用 了 compare 过 程 ,因此 它 不 是 叶子 过 程 。 所 以 ,其 栈 帧 中 除 
了 保留 所 用 的 保存 寄存 器 外 ,还 必须 保留 返回 地 址 $ra, 以 免 在 调用 过 程 compare 时 被 材 
盖 。 是 否 保 存 $ fp 要 看 具体 情况 ,如 果 确 保 后 面 一 直 都 用 不 到 $fp, 则 可 以 不 保存 它 ,但 编 
译 器 往往 无 法 预测 这 种 情况 ,所 以 通常 采用 统一 的 做 法 , 即 总 是 保存 $fp 的 值 。 因 而 ,该 过 
程 的 栈 帧 中 要 保存 的 信息 有 返回 地 址 $ra 和 帧 指针 $fp, 其 栈 帧 空间 大 小 为 4X2=8B。 

汇编 表示 如 下 : 


move $s0, $zero #sum=0 
sum array: addi $sp: $sp: -8 #generate stack frame 
Sw $ra, 4($sp) #save $ra on stack 
Sw $fp, 0($sp) #save $fp on stack 
addi S$fp, S$sp, 4 #set $fp 
move S$t2, $a0 #base address of array 
move S$t0, S$al #$t0=num 
move $t3, $zero #i=0 
loop: slt $t1l, S$t3, St0 #if (i<num) $t1=1 else $t1=0 
beq $t1l, S$zero, exitl #if ($t1l=0) jump to exitl 
move $a0, $t0 #$a0=num 
move S$al, $t3 #$al=i 
addi $al, S$al, 1 #$al=i+1 
jal compare #call compare 


beq $vO, S$zero, else #if ($v0=0) jump to else 


s11 $tl, S$t3, 2 #i=iX4 


add St St2y tl #$tl=array [i] 
1w $t4, 0($t1) #1lo0ad array [i] 
add $s0, $s0, S$t4 #sumt+=array [i] 
else: 和 #1i=i+1 
了 loop 
exitl: move $vO,$s0 #return sum 
1w $ra, 4($sp) #restore $ra 
1w $fp, 0($sp) #restore $fp 
addi S$sp, $sp, 8 #free stack frame 
rk $ra #return to caller 


(2) 过 程 compare: 人 口 参数 为 a 和 5, 分 别 在 $$ a0 和 $al 中 ,有 一 个 返回 参数 ,没有 局 
部 变量 ,是 叶子 过 程 , 且 过 程 体 中 没有 用 到 任何 保存 寄存 器 ,所 以 栈 帧 中 不 需要 保留 任何 


compare: move $v0, $zero # 起 初 返 回 值 设 定 为 0 
beq $a0, S$al, exit2 #if ($a0=$al) jump to exit2 
slt $t1l, $a0, S$al #if ($a0<$al) $tl=lelse $t1=0 
bne Stl， S$zero, exit2 #if ($a0<$al) jump to exit2 
ori $vO, $zeror 1 # 返 回 值 设 定 为 1 

exit2; ab $ra 


22. 以 下 是 一 个 计算 阶乘 的 C 语言 递归 过 程 ,请 按照 MIPS 过 程 调用 协议 写 出 该 递归 
过 程 对 应 的 MIPS 汇编 语言 程序 ,要 求 目标 代码 尽量 短 (提示 : 乘法 运算 可 用 乘法 指令 “mul 
rd，rs rt” 来 实现 ) 。 


int fact (int n) 
{ 
if (n<1) 
return (1)，; 
else 
return (nx fact (n-1) ) 
} 


【分 析 解 答 】 

过 程 fact 有 一 个 输入 参数 n, 按 MIPS 过 程 调用 协议 ,n 应 在 $a0 中 ,返回 参数 应 存放 
在 $v0 中 。 过 程 内 没有 局 部 变量 , 故 无 须 在 其 栈 帧 中 保留 局 部 变量 所 用 空间 ; 需 递归 调用 
fact 过 程 , 所 以 必须 在 其 栈 帧 中 保留 返回 地 址 $ra。 过 程 体 内 全 部 使 用 临时 寄存 器 $t0~~ 
$t9 ,因而 无 须 在 其 栈 帧 中 保存 通用 寄存 器 。 因 为 是 递归 调用 ,所 以 需 在 栈 帧 中 保留 输入 参 
数 。 因 此 ,该 过 程 的 栈 帧 中 要 保存 的 信息 有 返回 地 址 $ra、 帧 指针 $fp 和 输入 参数 $a0, 其 
栈 帧 空间 大 小 为 4 义 3 一 12B。 


fact: addi S$sp, $sp, -12 #generate stack frame 
sw $ra, 8($sp) #save $ra on stack 


Sw $fp, 4($sp) #save $fp on stack 
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addi $fp, $sp, 0 #set $fp 
sw $a0, 0($fp) #save $a0 (n) on stack 
slti $t0, $a0, 1 #if (n<1) $t0=1 else $t0=0 
bne St0， S$zero, exitl #if (n<1) goto exit1l 
addi $a0, $a0,-1 #n=n-1 
jal fact #call fact 
1w Stl， 0($fp) #restoren 
mul $vO, S$t1l, S$vO #$v0=n* fact (n-1) 
| exit 
exXitl: addi $v0O, S$zero, 1 #$vO0=1 
exit: 1w $ra, 8($sp) #restore $ra 
1w $fp, 4($sp) #restore $fp 
addi $sp, $sp, 12 #free stack frame 


je $ra #return to caller 


6.1 教学 目标 和 内 容 安排 


主要 教学 目标 : 

使 学 生 了 解 CPU 的 主要 功能 .CPU 的 内 部 结构 、 指 令 的 执行 过 程 、 数 据 通路 的 基本 组 
成 、 数 据 通路 的 定时 、 数 据 通路 中 信息 的 流动 过 程控 制 器 的 实现 方式 、 硬 连 线 路 控制 器 的 设 
计 、 微 程序 控制 器 的 设计 、 异 常 和 中 断 的 概念 等 ,为 进一步 深入 理解 流水 线 CPU 的 设计 原 
理 和 高 级 流水 线 技 术 打 下 基础 。 

基本 学 习 要 求 : 


(1) 
(2) 
(3) 
(4) 
(5) 
(6) 
(7) 
(8) 
(9) 
(10) 
(11) 
(12) 
(13) 
(14) 
(15) 
(16) 
(17) 
(18) 
(19) 
(20) 


了 解 CPU 的 主要 功能 。 

了 解 CPU 的 基本 结构 。 

理解 CPU 中 通用 寄存 器 和 专用 寄存 器 的 作用 。 

了 解 一 条 指令 的 基本 执行 过 程 。 

理解 指令 周期 ,机 器 周期 \ 时 钟 周 期 的 概念 及 其 相互 关系 。 
了 解数 据 通路 的 基本 组 成 。 


中 央 处 理 器 


了 解数 据 通 路 中 哪些 是 组 合 遇 和 辑 部 件 , 哪 些 是 时 序 玉 辑 部 件 。 


了 解数 据 通 路 中 的 组 合 逻 辑 部 件 和 时 序 逻 辑 部 件 的 差别 。 
了 解 寄 存 器 堆 的 作用 与 工作 原理 。 

了 解 多 路 选择 器 的 作用 与 工作 原理 。 

了 解 ALU 在 数据 通路 中 的 功能 。 

了 解 加 法 器 和 ALU 的 差别 。 

了 解 指令 存储 器 和 数据 存储 器 之 间 的 差别 。 
了 解 取 指 阶段 的 数据 流动 过 程 。 

了 解 寄存 器 取 数 过 程 。 

了 解数 据 运算 过 程 。 

了 解 存储 器 取 数 时 数据 流动 过 程 。 

了 解 寄存 器 存 数 时 数据 流动 过 程 。 

了 解 如 何 实现 条 件 转移 的 数据 通路 。 

了 解 如 何 实现 无 条 件 转移 的 数据 通路 。 
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(21) 了 解 “0” 扩 展 和 “符号 ”扩展 的 含义 和 实现 方式 。 

(22) 理解 如 何 确 定单 周期 数据 通路 的 时 钟 周 期 。 

(23) 理解 如 何 确定 多 周期 数据 通路 中 的 时 钟 周 期 。 

(24) 单 周 期 数据 通路 和 多 周期 数据 通路 的 差别 。 

(25) 理解 为 什么 很 少 有 机 器 采用 单 周 期 数据 通路 。 

(26) 理解 数据 通路 的 设计 和 CPI 之 间 的 关系 。 

(27) 理解 指令 格式 的 规整 性 对 数据 通路 设计 的 影响 。 

(28) 理解 各 个 控制 信号 的 含义 、 控 制 点 ,以 及 在 各 指令 中 的 取 值 。 
(29) 了 解 控 制 器 的 设计 步骤 和 实现 方式 。 

(30) 掌握 如 何 用 组 合 逻 辑 设计 方式 实现 硬 布 线 控制 器 。 

(31) 了 解 利 用 微 程序 设计 方式 实现 微 程序 控制 器 的 基本 原理 。 
(32) 理解 内 部 异常 和 外 部 中 断 的 概念 。 

(33) 理解 为 什么 在 设计 处 理 器 时 必须 考虑 异常 和 中 断 的 处 理 。 
(34) 了 解 如 何在 数据 通路 设计 中 考虑 异常 和 中 断 的 处 理 。 
(35) 理解 内 部 异常 和 外 部 中 断 的 区 别 。 

(36) 理解 常见 异常 事件 的 含义 和 处 理 方式 。 

(37) 了 解 带 中 断 的 指令 执行 过 程 。 


本 章 应 该 是 本 课程 的 核心 内 容 , 主 要 介绍 CPU 中 执行 指令 的 数据 通路 及 其 控制 逻辑 
电路 的 设计 。 其 重点 内 容 包 括 数据 通路 的 定时 、 单 周期 数据 通路 、 单 周期 控制 器 、 微 程序 概 
念 和 带 异 常 和 中 断 处 理 的 处 理 器 实现 。 

主教 材 ? 分 CPU 概述 、 单 周期 处 理 嚣 设计、 多 周期 处 理 器 设计 、 微 程序 控制 器 设计 、 异 
常 和 中 断 处 理 这 5 个 部 分 进行 了 介绍 。 

在 第 一 部 分 CPU 概述 中 ,给 出 了 CPU 设计 涉及 的 基本 问题 ,基本 概念 和 CPU 设计 的 
基本 思路 。 这 部 分 应 该 是 最 基础 的 内 容 , 学 生 应 该 很 好 地 掌握 。 不 过 ,对 其 中 一 些 概 念 和 知 
识 的 理解 ,还 需要 在 后 面具 体 的 数据 通路 设计 和 控制 器 设计 的 学 习 过 程 中 得 到 深化 。 因 此 ， 
在 后 面 单 周期 处 理 器 设计 和 多 周期 处 理 器 设计 的 内 容 介 绍 过 程 中 ,可 以 通过 对 具体 情况 的 
分 析 , 来 强化 CPU 概述 中 介绍 的 内 容 。 

为 了 全 面 清 楚 地 说 明 CPU 数据 通路 结构 的 发 展 过 程 , 主 教材 在 CPU 概述 中 简单 介绍 
了 早期 累加 器 型 指令 系统 的 数据 通路 . 单 总 线 数 据 通路 和 三 总 线 数据 通路 ,与 后 面 介绍 的 单 
周期 数据 通路 、 多 周期 数据 通路 ,以 及 第 7 章 介绍 的 流水 线 数据 通路 和 高 级 流水 线 数据 通路 
串 接 起 来 ,就 形成 了 数据 通路 结构 发 展演 变 的 技术 路 线 图 ,建议 教学 过 程 中 要 有 意识 地 帮助 
学 生理 解 这 个 技术 演变 过 程 , 并 分 析 这 种 演变 过 程 的 原因 所 在 。 在 这 部 分 内 容 中 ,可 对 有 关 
单 总 线 数据 通路 的 内 容 进行 较为 详细 的 介绍 ,而 对 早期 累加 器 型 指令 系统 的 数据 通路 和 三 
总 线 数 据 通路 简单 说 明 一 下 即 可 。 

在 介绍 单 周期 处 理 器 和 多 周期 处 理 器 设计 内 容 时 ,主要 以 MIPS 指令 系统 中 有 代表 性 
的 几 条 指令 作为 实现 目标 。 其 中 ,对 单 周期 处 理 器 设计 内 容 介绍 较为 详细 ,这 样 做 的 原因 有 
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光武 外 再 本 。 


两 个 ,第 一 ,因为 单 周 期 处 理 器 的 结构 与 流水 线 处 理 器 的 结构 比较 类 似 ,掌握 单 周期 数据 通 
路 及 其 控制 逻辑 电路 的 设计 方法 ,能 更 好 地 理解 流水 线 处 理 器 的 设计 方法 。 第 二 ,因为 单 周 
期 处 理 器 设计 过 程 比较 简单 ,便于 学 生理 解 CPU 设计 的 原理 性 内 容 。 因 此 ,建议 在 课堂 教 
学 中 对 单 周 期 处 理 器 的 设计 内 容 进 行 较为 详细 的 介绍 。 在 课时 有 限 的 情况 下 ,对 于 多 周期 
处 理 器 的 设计 ,就 无 须 详细 展开 讲解 ,只 要 简单 说 明 一 下 基本 设计 思想 和 基本 实现 原理 
即 可 。 

对 于 微 程序 控制 器 设计 ,着 重 讲 清楚 微 程 序 控制 器 的 基本 设计 思想 和 基本 结构 、 微 指令 
格式 和 微 命 令 编码 方式 ,以 及 微 程序 执行 顺序 的 控制 方式 。 主 教材 中 例 6. 2、 例 6.3 和 
例 6.4, 都 是 为 了 便于 理解 基本 原理 而 给 出 的 ,主要 是 为 了 给 学 生 提 供 具体 示例 ,以 达到 通 
过 对 概念 的 具体 运用 来 更 好 地 理解 概念 的 目的 。 对 于 这 些 例 子 , 在 课时 有 限 的 情况 下 ,课堂 
上 只 要 大 致 讲 一 下 字段 如 何 划 分 ,然后 对 其 中 的 一 个 字段 简单 说 明 一 下 如 何 编码 即 可 ,不 需 
要 在 课堂 上 详细 展开 讲解 ,细节 问题 都 可 留 给 学 生 自学 ,如 果 学 生 自学 时 不 能 明白 一 些 具体 
的 细节 问题 ,也 没有 关系 ,只 要 学 生 遂 过 例子 能 够 掌握 基本 原理 就 行 了 。 

本 章 最 后 一 个 内 容 是 异常 和 中 断 处 理 , 应 是 本 课程 和 操作 系统 课程 中 最 重要 的 概念 之 
一 ,对 学 生 将 来 从 事 处 理 器 设计 、 操 作 系统 开发 和 设计 、 肉 人 式 软 硬 件 设计 等 都 非常 有 用 。 
对 于 这 部 分 内 容 ,学 生 普遍 存在 的 一 些 问题 是 : 分 不 清 异 常 和 中 断 在 检测 、 响 应 和 处 理 过 程 
中 的 不 同 ;分 不 清 CPU 和 IO 接口 中 各 自 和 需要 对 异常 和 中 断 承担 哪些 职责 ;分 不 清 哪 些 由 
硬件 完成 哪些 由 软件 完成 。 因 为 CPU 设计 涉及 异常 和 中 断 , 所 以 ,本 章 中 应 把 CPU、 内 部 
异常 外 部 中 断 和 输入 /输出 控制 这 四 者 的 关系 交代 清楚 。 主 教材 对 内 部 异常 和 外 部 中 断 的 
基本 概念 ,以 及 异常 处 理 过 程 ,进行 了 较为 详细 的 说 明 , 并 结合 多 周期 数据 通路 及 其 反映 指 
令 执行 过 程 的 有 限 状 态 机 ,对 CPU 中 涉及 的 异常 和 中 断 处 理 功 能 及 部 件 进行 了 说 明 。 因 
为 是 结合 具体 数据 通路 进行 说 明 , 学 生 阅 读 起 来 应 该 比较 容易 明白 。 


6.2 主要 内 容 提要 


1. CPU 的 基本 功能 

CPU 总 是 周而复始 地 执行 指令 ,并 在 执行 指令 过 程 中 检测 和 处 理 内 部 异常 事件 和 外 部 
中 断 请 求 。 在 此 过 程 中 ,要 求 CPU 具有 以 下 各 种 功能 :四 取 指 令 并 译 码 。 从 存储 器 取 指 
令 , 对 指令 操作 码 译 码 ,以 控制 指令 进行 相应 的 操作 。 四 计算 PC 的 值 。 自 动 计 算 PC 的 值 
来 确定 下 条 指令 地 址 ,以 正确 控制 指令 的 执行 顺序 。@ 算 术 逻 辑 运算 。 计 算 操 作 数 地 址 ,或 
对 操作 数 进行 算术 或 逻辑 运算 。@ 取 操作 数 或 写 结果 。 通 过 控制 对 存储 器 或 IO 接口 的 
访问 来 读 取 操作 数 或 写 结果 。@ 异 常 或 中 断 处 理 。 检 测 有 无 异常 事件 或 中 断 请 求 ,必要 时 
响应 并 调 出 相应 的 处 理 程序 执行 。@ 时 序 控制 。 通 过 生成 时 钟 信号 来 控制 上 述 每 个 操作 的 
先后 顺序 和 操作 时 间 。 

2. CPU 的 基本 结构 

CPU 主要 由 数据 通路 (Datapath) 和 控制 单元 (Control Unit) 组 成 。 

数据 通路 中 包含 组 合 逻 辑 单元 和 存储 信息 的 状态 单元 。 组 合 逻 辑 单元 用 于 对 数据 进行 
处 理 , 如 加 法 器 .ALU、 扩 展 器 (0 扩展 或 符号 扩展 )、 多 路 选择 器 ,以 及 总 线 接口 逻辑 等 ;状态 
单元 包括 触发 器 、 寄 存 器 等 ,用 于 对 指令 执行 的 中 间 状 态 或 最 终结 果 进 行 保存 。 
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控制 单元 也 称 为 控制 器 ,主要 功能 是 对 取出 的 指令 进行 译 码 , 并 与 指令 执行 得 到 的 条 件 
码 或 当前 机 器 的 状态 .时 序 信号 等 组 合 ,生成 对 数据 通路 进行 控制 的 控制 信号 。 

3， CPU 中 的 寄存 器 

CPU 中 存在 大 量 寄存 器 ,根据 对 用 户 程 序 的 透明 程度 可 以 分 成 以 下 3 类 。 

(1) 用 户 可 见 寄存 器 

指 用 户 程序 中 的 指令 可 直接 访问 或 间接 修改 其 值 的 寄存 器 。 包 括 通 用 寄存 器 、 地 址 寄 
存 器 和 程序 计数 器 PC。 通 用 寄存 器 可 用 来 存放 地 址 或 数据 ;地 址 寄存 器 专门 用 来 存放 首 地 
址 或 指针 信息 ,如 有 段 寄存 器 、 变 址 寄存 器 、 基 址 寄存 器 、 堆 栈 指针 、 帧 指针 等 ;程序 计数 器 PC 
存放 当前 或 下 一 条 指令 的 地 址 。 

《2) 用 户 部 分 可 见 寄存 器 

指 用 户 程序 中 的 指令 只 能 读 取 部 分 信息 的 寄存 器 ,如 程序 状态 字 寄 存 器 PSWR 或 标 
志 寄 存 器 FLAG ,其 内 容 由 CPU 根据 指令 执行 结果 自动 设 定 , 用 户 程序 执行 过 程 中 可 能 
会 隐 含 读 出 其 部 分 内 容 , 以 确定 程序 的 执行 顺序 ,但 不 能 修改 这 些 寄存 器 的 内 容 。 

(3) 用 户 不 可 见 寄存 器 

指 用 户 程序 不 能 进行 任何 访问 的 寄存 器 ,这 些 寄存 器 大 多 用 于 记录 控制 信息 和 状态 信 
息 , 只 能 由 CPU 硬件 或 操作 系统 内 核 程序 访问 。 例 如 ,指令 寄存 器 IR 用 来 存放 正在 执行 
的 指令 ,只 能 被 硬件 访问 ;存储 器 地 址 寄存 器 (MAR) 和 存储 器 数据 寄存 器 CMDR) 分 别 用 来 
存放 将 要 访问 的 存储 单元 的 地 址 和 数据 ,也 由 硬件 直接 访问 ;中 断 请 求 寄存 器 、 进 程控 制 块 
指针 、 页 表 基 址 寄存 髓 等 只 能 由 内 核 程 序 访问 ,因此 也 都 是 用 户 不 可 见 寄存 器 。 

4. 指令 执行 过 程 

指令 执行 过 程 大 致 分 为 取 指 、 译 码 、 取 数 、 运 算 、 存 结果 、 查 中 断 等 步骤 。 指 令 周 期 是 指 
取出 并 执行 一 条 指令 的 时 间 , 它 由 若干 机 器 周期 或 直接 由 若干 时 钟 周期 组 成 。 早 期 的 机 器 
因为 没有 引入 cache, 所 以 每 个 指令 周期 都 要 执行 一 次 或 多 次 总 线 操作 ,以 访问 主 存 取 得 指 
令 或 进行 数据 读 写 ,因而 将 指令 周期 分 成 若干 机 器 周期 。 每 个 机 器 周期 对 应 某 种 CPU 内 
部 操作 或 某 种 总 线 事务 ,一 个 总 线 事务 访问 一 次 主 存 或 1/O 接口 。 一 个 总 线 事务 包含 送 地 
址 和 读 写 命令 .等 待 主 存 . 读 写 数据 等 , 故 需 要 多 个 时 钟 周期 才能 完成 ,所 以 一 个 机 器 周期 由 
多 个 时 钟 周期 组 成 。 现 代 计 算 机 引入 cache 后 ,大 多 数 情况 下 都 不 需要 访问 主 存 , 而 可 以 直 
接 在 CPU 内 的 cache 中 读 指令 或 访问 数据 ,因此 ,每 个 指令 周期 直接 由 若干 时 钟 周期 组 成 。 
时 钟 是 CPU 中 用 于 同步 控制 的 信号 ,时钟 周期 是 CPU 中 最 小 的 时 间 单 位 。 

5. 数据 通路 的 实现 

现代 计算 机 都 采用 时 钟 信号 进行 定时 ,一 旦 时 钟 边沿 信号 到 来 ,数据 通路 中 的 状态 单元 
开始 写 人 人 信息。 不 同 指令 其 功能 不 同 ,所 以 ,每 条 指令 执行 时 数据 在 数据 通路 中 所 经 过 的 路 
径 及 其 路 径 上 的 部 件 都 可 能 不 同 。 不 过 ,每 条 指令 在 取 指 令 阶 段 所 做 的 工作 都 一 样 。 

根据 是 否 将 所 有 部 件 通过 总 线 相连 ,可 将 数据 通路 分 成 总 线 式 数据 通路 和 非 总 线 式 数 
据 通 路 ;根据 指令 执行 过 程 是 否 按 流水 线 方式 进行 ,可 将 数据 通路 分 成 非 流 水 线 数据 通路 和 
流水 线 数据 通路 。 总 线 式 数据 通路 无 法 实现 指令 流水 线 , 所 以 ,一 定 是 非 流 水 线 数据 通路 。 
现代 计算 机 都 采用 流水 线 数据 通路 。 

总 线 式 数据 通路 中 ,寄存 器 和 ALU 的 输入 、 输 出 端 之 间 都 通过 CPU 内 部 总 线 交换 数 
据 , 因 为 一 个 总 线 上 某 一 时 刻 只 能 传送 一 个 部 件 送 出 的 信息 ,所 以 ,总 线 式 CPU 中 执行 指 


令 时 ,每 一 步 都 只 能 串 行 进行 ,速度 很 慢 。 若 所 有 部 件 连接 到 一 个 总 线 上 , 则 是 单 总 线 数 
据 通 路 ;还 可 以 将 ALU 的 输入 和 输出 端 分 别 连 到 不 同 的 两 个 总 线 上 ,构成 双 总 线 数据 道 
路 ;还 可 以 将 ALU 的 两 个 输入 端 和 一 个 输出 端 分 别 连 接 到 3 个 总 线 上 构成 三 总 线 数据 
通路 。 

非 总 线 式 数据 通路 可 设计 成 单 周 期 数据 通路 、 多 周期 数据 通路 和 流水 线 数据 通路 。 以 
下 用 例子 来 说 明 单 周期 和 多 周期 数据 道路 的 实现 。 流 水 线 数据 通路 在 第 7 章 介绍 。 

6. 数据 通路 设计 举例 

以 下 以 MIPS 指令 为 例 , 概 要 介绍 单 周期 和 多 周期 数据 通路 的 设计 原理 和 设计 步骤 。 

〈1) 确定 实现 目标 。 为 方便 起 见 , 假 定 实现 目标 如 表 6.1 所 示 的 11 条 MIPS 指令 。 


表 6.1 11 条 目标 指令 及 其 功能 描述 


指 令 功 能 说 明 
add rd, rs, rt 从 rs、rt 中 取 数 后 相 加 / 减 , 若 溢出 则 异常 处 
sub rd, rs, rt 理 ,否则 ,结果 送 rd 
从 rs、rt 中 取 数 后 相 减 ,结果 送 rd( 不 进行 溢出 
判断 ) 


R[rd]<-R[rs] 圭 RL[rt] 


subu rd, rs, rt R[Lrd]<—R[rs]—R[Lrt] 


if (RLrs]<R[rt]) 从 rs、tt 中 取 数 后 按 带 符号 整数 判断 两 数 大 

slt rd, rs, tt R[rd] 一 1 else 小 。 若 小 于 则 rd 中 置 1, 否 则 ,rd 中 清 “0”( 不 
R[rd] 一 0 进行 溢出 判断 》 

if CR[rs]<R[rt]) 从 rs、rt 中 取 数 后 按 无 符号 数 判 断 两 数 大 小 。 

sltu rd, rs, rt R[rdj<1 else 车 小 于 则 rd 中 置 1, 否 则 ,rd 中 清 “0”( 不 进行 


R[rd]<—0 溢出 判断 ) 

从 rs 取 数 ,将 立即 数 imm16 进行 零 扩 展 ,然后 

两 者 按 位 “或 ”结果 送 rt 

从 rs 取 数 ,将 立即 数 imml6 进行 符号 扩展 , 然 

后 两 者 相 加 ,结果 送 rt( 不 进行 溢出 判断 》 

从 rs 取 数 ,将 立即 数 imml6 进行 符号 扩展 , 然 

后 两 者 相 加 ,结果 作为 访 存 地 址 

从 存储 单元 Addr 中 取 数 并 送 rt 

从 rs 取 数 ,将 立即 数 imm16 进行 符号 扩展 , 然 

后 两 者 相 加 ,结果 作为 访 存 地 址 

从 寄存 器 rt 取 数 并 送 存储 单元 Addr 中 

作 减 法 以 比较 rs 和 rt 中 内 容 的 大 小 

Cond<—R[rs]— RLrt] 计算 下 条 指令 地 址 (根据 比较 结果 ,修改 PC) 

beq rs, rt, imm16 | if (Cond eq 0) 转移 目标 地 址 采用 相对 寻 址 ,基准 地 址 为 下 条 
PC<-PC 十 (SignExt(imm16)X4) | 指令 地 址 ( 即 PC 十 4) ,位 移 量 为 立即 数 imm16 

经 符号 扩展 后 的 值 的 4 售 


vt PC<31:2> 生 PC<<31:28>> | | 第 一 步 无 须 进行 PC 十 4 而 直接 计算 目标 地 址 ， 
CD target<25:0> 符号 ‖ 表示 “拼接 ” 


表 6. 1 给 出 了 每 条 指令 功能 的 RTL 描述。 每 条 指令 的 取 指 阶段 功能 都 一 样 ,都 需 
要 从 PC 所 指 的 内 存单 元 取 指 令 , 并 使 PC 加 4。 为 避免 重复 说 明 , 表 中 省 略 了 对 取 指 
阶段 功能 的 描述 。 


ori rt, rs, imm16 | RIrt]<—R[rs] | ZeroExt(imm16) 


addiu rt, rs, imml16 | RLrt]<—R[rs]+SignExt(imm16) 


Addr<—R[rs]+SignExt(imm]16) 
R[Lrt] 一 MLAddr] 


lw rt, rs, imm16 


Addr<—R[rsj+ SignExt(imm16) 
M[ Addr]<—R[Lrt] 


Sw tt, rs, imml6 


计算 机 组 成 与 系统 对 欧 习 是 解答 与 裘 学 持 蛙 


图 6.1 给 出 了 3 种 MIPS 指 令 格式 , 表 6. 1 中 前 5 条 是 R- 型 指令 ,随后 5 条 是 工 型 指 
令 , 最 后 一 条 跳 转 指令 “j target” 是 丁 型 指令 。 


31 2625 2120 1615 1110 65 0 
000000 rs rt rd shamt fone | 
(a) R- 型 指令 
31 2625 2120 1615 0 
op TS rt imm16 
(0) 型 指令 
31 26 25 0 
op target 


() 上 型 指令 
图 6.1 MIPS 指令 格式 


(2) 设计 ALU 电路 。 对 目标 指令 中 涉及 的 所 有 运算 进行 分 析 , 确 定 用 于 这 些 运算 的 
ALU 及 其 控制 电路 如 何 设计 。 从 表 6.1 可 以 看 出 ,这 11 条 指令 涉及 的 运算 包括 带 溢出 检 
测 的 加 法 和 减法 、 带 符号 整数 大 小 判断 、 无 符号 数 大 小 判断 、 相 等 判断 以 及 各 种 逻辑 运算 等 。 
图 6.2 给 出 了 实现 这 些 运算 的 ALU 电路 。 


Ch : 
| : 
Add-carry : 

Ei ) ==== : Zero 


> 加 Add-Overflow : Overflow 
法 Add-Sign < 
器 [Add-Result 
Less 
: Result 


ALU 操作 控制 信号 
生成 部 件 


1 
ALUctr 


6.2 11 条 目标 指令 的 ALU 实现 


上 述 ALU 中 的 核心 部 件 是 加 法 器 ,减法 运算 也 在 该 加 法 器 中 实现 ,加 法 器 有 进位 标志 
Add-carry、 零 标志 Zero 溢出 标志 Add-Overflow 和 符号 标志 Add-Sign。 该 ALU 的 输入 为 
两 个 32 位 操作 数 A 和 B,Result 作为 ALU 运算 的 结果 被 输出 ,同时 , 零 标志 Zero 和 溢出 


闻 尖 处理 要- 


| 第 
6 
| 章 


标志 Overflow 也 被 作为 ALU 的 结果 标志 信息 输出 。 

为 了 实现 对 ALU 操作 的 控制 ,需要 有 相应 的 操作 控制 信号 。 在 操作 控制 端 ALUetr 
的 控制 下 ,图 6.2 中 的 “ALU 操作 控制 信号 生成 部 件 ” 用 来 生成 各 种 操作 控制 信号 ,以 控制 
在 ALU 中 执行 “加 法 ”、“ 减 法 ”、“ 按 位 或 ”"“ 带 符号 整数 比较 小 于 置 1” 和 “无 符号 数 比 较 小 
于 置 1” 等 运算 。 

(3) 设计 取 指 令 部 件 。 取 指令 操作 是 每 条 指令 的 公共 操作 ,其 功能 是 取 指 令 并 计算 下 
一 条 指令 地 址 。 若 是 顺序 执行 , 则 下 一 条 执行 指令 地 址 为 PC 十 4; 若 是 转移 执行 , 则 要 根据 
当前 指令 是 分 支 指令 还 是 跳 转 指令 分 别 计算 转移 目标 地 址 。 因 为 指令 长 度 为 32 位 , 主 存 按 
字 节 编 址 ,所 以 指令 地 址 总 是 4 的 倍数 , 即 最 后 两 位 总 是 00, 因 此 ,PC 中 只 需 存放 前 30 位 
地 址 PC<<31:2> ,在 取 指 令 时 ,指令 地 址 =PC<31:2> |‖*00?。 下 条 指令 地 址 的 计算 方法 
如 下 。 

顺序 执行 指令 时 : PC<31:2>><PC<31:2 之 十 1。 

Branch 指令 条 件 满足 时 : PC<31:2 汪 ><PC<31:2 疙 十 1 十 SignExt[imm16]。 

Jump 指令 跳 转 执行 时 : PC< 31:2 之 <PC<<31:28>> | target< 25:0>。 

根据 上 述 指令 地 址 计算 方法 ,图 6. 3 给 出 了 完整 的 取 指 令 部 件 。 

Ji 


一 Addr<31:2> 
=007| Addr<1:0> 
指令 存储 器 


\cexNW-/ ~-H- 
谎 
俏 
| 
这 
3 


! | 下 地 址 逻辑 


Braneh | | Zero 
图 6.3 完整 的 取 指 令 部 件 


取 指 令 部 件 的 输出 是 指令 ,输入 有 3 个 : 标志 Zero 和 控制 信号 Branch、Jump。 下 地 址 
逻辑 中 的 立即 数 imm16 和 目标 地 址 target<<25:0 二 都 直接 来 自 取出 的 指令 。 分 支 指令 时 ， 
Branch 王 1,Jump 王 0; 跳 转 指令 时 ,Branch 一 0,Jump 一 1。 

(4) 单 周期 数据 通路 设计 。11 条 指令 中 ,lw 指令 最 复杂 ,执行 lw 指令 过 程 中 数据 所 经 
过 的 部 件 最 多 ,路径 最 长 ,因此 ,以 它 为 基准 设计 单 周 期 数据 通路 。 图 6.4 给 出 了 能 够 执行 
11 条 目标 指令 的 完整 的 单 周期 数据 通路 。 

图 6.4 中 带 下 划 线 的 是 控制 信号 ,用 于 控制 数据 通路 的 执行 ,由 专门 的 控制 迎 辑 单元 根 
据 当 前 指令 的 译 码 结 果 生 成 控制 信号 。 

(5) 时 钟 周期 的 确定 。 单 周期 处 理 器 每 条 指令 在 一 个 时 钟 周 期 内 完成 ,所 以 CPI 为 1， 
时 钟 周期 通常 取 最 复杂 指令 所 花 的 指令 周期 。 在 给 出 的 11 条 指令 中 ,最 长 的 是 lw 指令 周 
期 。 图 6.5 给 出 了 lw 指令 执行 定时 过 程 ,从 图 中 可 以 看 出 ,lw 指令 周期 所 包含 的 时 间 为 
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RegWTr1 Instruction<31:0> 
| Rd Rt Baneh -| 取 指令 
Jp -| 部 件 
0. 0 7 RoeDst ck 一 一 
Rs Rt Op Rs Rt Rd imml6 
5 让 让 
Rw Ra Rb uA A ee 
busW 32 32bit |Overfiow 
E 
32 Registers 如 0 
Clk busB ,lo 2 所 
b 32| | f Memwrl 1 3 8 
扩 & 计 ER ~ WrEn Adr | ml 
imml16 一 一 一 一 | 展 上 Bn 数据 1 
16 器 | 32 1 存储 器 1 
上 1 Clk Fl MemtoReg 
i ALUSrc ! 0 -一 一 一 
ExtOp ALUctr | 
图 6.4 完整 的 单 周期 数据 通路 
PC 锁 存 延迟 (Clk-to-Q) 十 取 指 令 时 间 十 寄存 器 取 数 时 间 十 ALU 延迟 十 存储 器 取 数 时 间 十 
寄存 器 建立 时 间 十 时 钟 偏 移 。 
Clk 
-| 一 一 Clkrto-Q lado EC 
PC 一 旧 御 1!X 新 人 | KE 
1 一 | 取 指 令 时 间 ! | 
s, Rt, Rd, EE 
op, ne | 
| 一 ~ 控制 单元 延迟 ! 
ALUctr 1 日 值 x 新 值 1 
1 
新 人 1 


ALUSrc 


MemtoReg 


新 于 


新 值 


| | 写 目的 寄存 器 
RegWr 1 日 值 I \ 新 值 
! | | 一 | 寄存 办 取 数 时 间 
| 


busB 


Address 


| 存储 器 取 数 时 间 | 人 
busw 二 上 一 一 Ka 
1 1 


图 6.5 lw 指令 执行 定时 


单 周期 处 理 器 时 钟 周期 远 远大 于 许多 指令 实际 所 需 执行 时 间 , 例 如 ,R- 型 指令 和 立即 
数 运算 指令 都 不 需要 读 内 存 ;sw 指令 不 需要 写 寄存 器 ;分 支 指令 不 需要 访问 内 存 和 写 寄存 
器 ; 跳 转 指令 不 需要 ALU 运算 和 内 存 ( 寄 存 器 ) 的 读 写 。 因 面 , 单 周期 处 理 器 的 效率 低下 ， 
性 能 极 差 ,实际 上 ,现在 很 少 用 单 周期 方式 设计 CPU。 介 绍 单 周 期 数据 通路 ,只 是 为 了 帮助 
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理解 实际 的 多 周期 和 流水 线 两 种 方式 。 

(6) 多 周期 数据 通路 设计 。 多 周期 处 理 器 的 基本 思想 为 : 把 每 条 指令 的 执行 分 成 多 个 
大 致 相等 的 阶段 ,每 个 阶段 在 一 个 时 钟 周期 内 完成 ;各 阶段 内 最 多 完成 1 次 访 存 或 1 次 寄存 
器 读 / 写 或 1 次 ALU 操作 ;各 阶段 的 执行 结果 在 下 一 个 时 钟 到 来 时 保存 到 相应 存储 单元 或 
稳定 地 保持 在 组 合 电路 中 ;时钟 周 期 的 宽度 以 最 复杂 阶段 所 花 时 间 为 准 , 通 常 取 一 次 存储 器 
读 写 的 时 间 。 图 6. 6 给 出 了 实现 11 条 目标 指令 的 多 周期 数据 通路 ,其 中 带 下 划 线 的 是 控制 
信号 。 


PCWr RegWr 


—,__PCWrCond 一 Overflow 
一 一 一 ze 
lorD MemWr JIRWT RegDst ALUSelA BrWr PCSource 
1 1 1 ， 
1 


' 1 
ALUOP R-type 


1 
ALUSelB 


图 6.6 带 控制 信号 的 多 周期 数据 通路 


(7) 分 析 每 条 指令 的 执行 过 程 ,得 到 指令 执行 状态 转换 图 。 每 条 指令 在 取 指 令 周 期 
(IFetch) 和 取 数 / 译 码 周期 (RFetch/ID) 所 进行 的 操作 完全 一 样 。 除 了 取 指 令 和 译 码 / 取 数 
两 个 周期 外 ,在 11 条 目标 指令 中 ,R- 型 指令 还 需要 一 个 执行 周期 (RExec) 和 一 个 结束 回 写 
周期 (RFinish) ;ori 指令 也 还 需要 一 个 执行 周期 (oriExec) 和 一 个 结束 回 写 周期 (oriFinish) 
分 支 指令 和 跳 转 指令 都 是 只 需要 一 个 周期 ,分别 是 BrFinish 和 JumpFinish;lw 和 sw 共用 
一 个 主 存 地 址 计算 周期 (MemAdr) ,然后 根据 指令 是 lw 还 是 sw, 确 定 后 面 是 写 主 存 周期 
CswFinish), 还 是 取 数 周期 (MemFetch) 和 写 寄存 器 周期 (IwFinish)。11 条 指令 在 图 6.6 所 
示 的 多 周期 数据 通路 中 执行 时 的 状态 转换 过 程 如 图 6.7 所 示 。 

图 6.7 反映 了 指令 在 多 周期 数据 通路 中 执行 时 的 状态 转换 过 程 ,每 个 周期 对 应 一 个 状 
态 。 每 来 一 个 时 钟 ,进入 下 一 个 执行 状态 。 从 图 6. 7 可 以 看 出 ,R- 型 指令 、 工 型 运算 类 指令 
和 sw 指令 的 CPI 都 是 4;lw 指令 的 CPI 为 5; 分 支 指令 和 跳 转 指令 的 CPI 为 3。 
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0:TFetch 1:RFetchTD 2:BrFinish 
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图 6.7 指令 执行 状态 转换 图 


7, 控制 逻辑 单元 的 实现 

根据 不 同 的 控制 描述 方式 ,可 以 有 硬 连 线路 控制 器 和 微 程 序 控制 器 两 种 实现 方式 。 

硬 连 线路 控制 器 的 基本 实现 思路 : 将 指令 执行 过 程 中 每 个 时 钟 周期 所 包含 的 控制 信 
号 取 值 组 合 看 成 一 个 状态 ,每 来 一 个 时 钟 ,控制 信号 会 有 一 组 新 的 取 值 ,也 就 是 一 个 新 的 
状态 ,这样 ,所 有 指令 的 执行 过 程 就 可 以 用 一 个 有 限 状 态 转换 图 来 描述 ,如 图 6.7 所 示 。 
实现 时 ,用 一 个 组 合 逻 辑 电 路 (一 般 为 PLA 电路 ?来 生成 控制 信号 ,用 一 个 状态 寄存 器 实 
现状 态 之 间 的 转换 。 

微 程序 控制 器 的 基本 实现 思路 : 将 指令 执行 过 程 中 每 个 时 钟 周期 所 包含 的 控制 信号 取 
值 组 合 看 成 是 一 个 0/1 序列 ,每 个 控制 信号 对 应 一 个 微 命令 ,控制 信号 取 不 同 的 值 ,就 发 出 
不 同 的 微 命令 。 这 样 ,若干 微 命 令 组 合成 一 个 微 指 令 , 每 条 指令 所 包含 的 动作 就 由 若干 条 微 
指令 来 完成 。 指 令 执行 时 , 先 找到 对 应 的 第 一 条 微 指令 ,然后 按照 特定 的 顺序 取出 后 续 的 微 
指令 执行 。 每 来 一 个 时 钟 ,执行 一 条 微 指令 。 实 现时 ,每 条 指令 对 应 的 微 指令 序列 ( 称 为 微 
程序 ) 事 先 存放 在 一 个 只 读 存储 器 ( 称 为 控制 存储 器 ,简称 控 存 ) 中 ,用 一 个 PLA 电路 或 
ROM 来 生成 每 条 指令 对 应 的 微 程序 的 第 一 条 微 指令 地 址 ,用 相应 的 微 程序 定 序 器 来 控制 
微 指令 执行 流程 。 微 程序 定 序 器 的 实现 有 计数 器 法 ( 增 量 法 ) 和 断定 法 (下 址 字段 法 ) 两 种 。 

8. 内 部 异常 和 外 部 中 断 

在 程序 正常 执行 过 程 中 ,CPU 会 遇 到 一 些 特殊 情况 而 无 法 继续 执行 当前 程序 。 这 种 中 
断 程序 正常 执行 的 情况 主要 有 两 大 类 : 内 部 异常 和 外 部 中 断 。 

内 部 异常 指 CPU 内 部 在 执行 某 条 指令 时 发 生 的 程序 异常 或 硬件 异常 ,有 故障 陷阱 和 
终止 3 种 类 型 ,也 被 称 为 程序 性 中 断 或 软 中 断 。(1) 故 障 是 指 某 条 正在 执行 的 指令 产生 的 异 
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常 ,如 “溢出 ”“ 除 数 为 0”“ 非 法 操作 码 ”“ 缺 页 ”“ 地 址 越界 ”“ 访 问 越权 ”、“ 段 不 存在 ”、 
“堆栈 溢出 ?等 ,有 些 故障 修复 后 程序 可 以 继续 执行 下 去 ,有 些 故 障 不 能 修复 ,只 能 中 止 发 生 
异常 的 程序 的 执行 , 若 修复 后 程序 能 继续 执行 下 去 , 则 异常 处 理 后 通常 回 到 发 生 故障 的 指令 
重新 执行 (27 陷阱 是 预先 安排 的 一 种 “异常 事件 ,例如 ,由 断 点 设置 . 单 步 跟踪 、 系 统 调用 、 
条 件 自 陷 等 引起 ,通常 异常 处 理 后 回 到 被 中 断 处 下 一 条 指令 执行 ;(3) 终 止 指 严重 的 硬件 故 
麻 ,一 旦 发 生 只 能 终止 整个 系统 的 运行 ,重启 系统 。 

外 部 中 断 是 指 外 设 通过 中 断 请 求 线 向 CPU 提出 的 处 理 请 求 , 它 与 指令 的 执行 无 关 。 
它 作 为 外 设 的 一 种 TO 方式 ,能 带 来 CPU 和 外 设 在 一 定 程 度 上 的 并 行 性 。 有 关外 部 中 断 
的 内 容 主 要 在 第 9 章 介绍 。 


6.3 ”基本 术语 解释 


指令 周期 (Instruction Cycle) 

CPU 总 是 周而复始 地 取出 指令 并 执行 。 因 此 ,把 取出 一 条 指令 并 执行 完 所 用 的 全 部 时 
间 称 为 指令 周期 。 一 个 指令 周期 中 要 完成 多 个 步骤 的 操作 ,包括 取 指 令 、 指 令 译 码 、 计 算 操 
作 数 地 址 、 取 操作 数 、 运 算 、. 送 结果 、 中 断 检 测 等 。 

机 器 周期 (Machine Cycle) 

在 指令 周期 中 ,最 复杂 的 操作 是 访问 存储 器 以 获取 指令 或 读 / 写 数据 ,以 及 访问 W/O。 
在 没有 片 内 cache 的 情况 下 ,它们 都 需 通 过 系统 总 线 来 和 CPU 之 外 的 部 件 进行 信息 交换 。 
因此 ,通常 把 CPU 通过 一 次 总 线 事务 访问 一 次 主 存 或 I/O 的 时 间 称 为 机 器 周期 。 

一 个 指令 周期 包含 了 多 个 机 器 周期 。 不 同 机 器 的 指令 周期 所 包含 的 机 器 周期 数 不 同 。 
典型 的 机 器 周期 有 : 取 指 令 、 主 存 读 ( 间 址 周期 是 一 种 主 存 读 机 器 周期 )、 主 存 写 、1/O 读 、 
IO 写 .中 断 响应 等 。 一 台 计 算 机 的 机 器 周期 类 型 是 确定 的 。 

现代 计算 机 采用 CPU 片 内 cache 来 存放 指令 和 数据 ,因此 指令 和 数据 的 读 取 、 数 据 的 
运算 和 传输 都 非常 快 ,所 以 ,一 条 指令 的 执行 在 一 个 或 若干 个 时 钟 内 就 可 以 完成 ,不 再 将 指 
令 周 期 细 分 为 若干 机 器 周期 。 

同步 系统 (Synchronous System) 

系统 中 所 有 的 动作 都 有 专门 的 时 序 信号 来 定时 ,最 基本 的 时 序 信和 号 就 是 时 钟 信号 ,同步 
系统 通过 时 钟 信号 来 规定 何 时 发 出 什么 动作 。 例 如 ,在 CPU 内 部 ,一 个 指令 的 执行 要 完成 
数据 的 读 / 写 、 传 送 或 运算 等 。 因 此 ,指令 的 执行 过 程 必须 分 解 成 若干 步骤 和 相应 的 动作 来 
完成 ,每 一 步 动 作 都 要 有 相应 的 控制 信号 进行 控制 ,这 些 控制 信号 何 时 发 出 、 作 用 时 间 多 长 ， 
都 要 有 相应 的 定时 信号 进行 同步 ,这 个 定时 信号 就 是 时 钟 信号 。 

时 序 信号 (Timing Signal) 

同步 系统 中 用 于 进行 同步 控制 的 定时 信和 号。 早期 计算 机 的 处 理 器 设计 时 ,采用 机 器 周 
期 -节拍 -工作 脉冲 三 级 时 序 系统 。 现 代 计 算 机 一 般 只 用 一 个 专门 的 时 钟 信 号 来 进行 定时 。 
因此 ,现代 计算 机 的 时 序 信号 就 是 时 钟 信号 。 

控制 单元 (Control Unit,CU) 

也 称 为 控制 部 件 、 控 制 逻 辑 或 控制 器 。 其 作用 是 对 指令 进行 译 码 , 将 译 码 结果 和 状态 / 
标志 信和 号 和 时 序 信号 等 进行 组 合 ,产生 各 种 操作 控制 信和 号。 这些 控 制 信号 被 送 到 CPU 内 
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部 或 通过 总 线 送 到 主 存 或 IO 模块 。 送 到 CPU 内 部 的 控制 信号 用 于 控制 CPU 内 部 数据 
通路 的 执行 , 送 到 主 存 或 IO 模块 的 信号 控制 CPU 和 主 存 或 CPU 和 I/O 模块 之 间 的 信息 
交换 。 控 制 单 元 是 整个 CPU 的 指挥 控制 中 心 ,通过 规定 各 部 件 在 何 时 做 什么 动作 来 控制 
数据 的 流动 ,以 完成 指令 的 执行 。 

执行 部 件 (Execute Unit, EU) 

也 称 为 操作 部 件 或 功能 部 件 ,由 控制 部 件 CU 发 来 的 操作 控制 信号 进行 控制 ,以 完成 特 
定 的 功能 。 有 两 种 类 型 的 执行 部 件 , 一 种 是 用 组 合 逻 辑 电路 实现 的 “操作 元 件 ”, 用 于 进行 数 
据 运 算 、 数 据 传 送 等 ,如 ALU 总线、 扩展 器 、 多 路 选择 器 等 ; 男 一 种 是 用 时 序 逻 辑 电 路 实现 
的 “状态 元 件 ”, 用 于 进行 数据 存储 ,如 触发 器 、 寄 存 器 、 存 储 器 等 。 

组 合 逻 辑 电路 (Combinational Logic Circuit) 

简称 组 合 电 路 ,用 来 构成 “操作 元 件 ”。 组 合 逻 辑 电路 在 逻辑 功能 上 的 特点 是 ,任意 时 刻 
的 输出 仅仅 取决 于 该 时 刻 的 输入 ,与 电路 原来 的 状态 无 关 , 因 此 , 它 没有 存储 功能 。 

时 序 逻 辑 电路 (Sequential Logic Circuit) 

简称 时 序 电路 ,用 来 构成 “状态 元 件 ”。 时 序 迎 辑 电 路 在 逻辑 功能 上 的 特点 是 ,任意 时 刻 
的 输出 不 仅 取决 于 当时 的 输入 信号 ,而 且 还 取决 于 电路 原来 的 状态 ,或 者 说 ,还 与 以 前 的 输 
入 有 关 。 时 序 逻 辑 电 路 具有 存储 功能 ,能 保存 所 存储 的 状态 。 

扩展 器 (Extension Unit) 

将 一 个 n 位 数 扩展 成 2n 位 数 的 部 件 。 一 般 有 两 种 扩展 方式 :“ 零 ”扩展 和 “符号 ”扩展 。 

“ 零 ? 扩 展 (0-Extend) 

高 n 位 用 0? 填充。 例如 ,在 MIPS 指令 系统 中 ,一 个 16 位 的 逻辑 数 需 先进 行 “0? 扩 展 ， 
扩展 为 32 位 数 后 ,在 32 位 ALU 中 进行 逻辑 运算 。“0” 扩 展 可 以 看 成 是 对 无 符号 数 的 扩 
展 ,扩展 前 后 数值 不 变 。 

“符号 ”扩展 (Sign Extend) 

高 n 位 用 扩展 前 的 n 位 数 的 符号 位 填充 。 例 如 ,在 MIPS 指令 系统 中 ,Load/Store 指令 
中 的 存储 器 地 址 偏 移 量 需 先进 行 “符号 ?扩展 ,将 16 位 偏 移 量 扩展 为 32 位 后 , 送 到 32 位 的 
ALU 中 ,和 基 址 进行 加 法 运算 。“ 符 号 ?扩展 可 以 看 成 是 对 有 符号 数 扩展 ,扩展 前 后 数值 
不 变 。 

多 路 选择 器 (Multiplexor) 

也 称 数 据 选择 器 或 多 路 复 用 器 。 它 根据 控制 线路 的 设置 ,选择 多 个 输入 信号 中 的 一 个 
进行 输出 。 

定时 方式 (Clocking Methodology) 

在 时 序 电路 中 ,定时 方式 规定 了 状态 存储 元 件 何 时 读 出 信号 、 何 时 写 人 信和 号。 一 般 采 用 
边沿 触发 的 定时 方式 。 

边沿 触发 (Edge-triggered) 

规定 存储 元 件 中 的 状态 只 允许 在 时 钟 跳 变 边 沿 改变 。 时 钟 信号 的 跳 变 有 正 跳 变 和 负 跳 
变 两 种 。 在 时 钟 的 上 升 沿 进 行 的 跳 变 为 正 跳 变 ;在 时 钟 的 下 降 沿 进行 的 跳 变 为 负 跳 变 。 

寄存 器 堆 (Register File) 

寄存 器 堆 就 是 寄存 器 集合 ,所 以 也 称 为 通用 寄存 器 组 CGRS) 。 其 中 的 寄存 器 可 以 通过 
给 定 相 应 的 寄存 器 编号 来 进行 读 写 。 在 指令 中 用 编导 标识 寄存 器 。 执 行 指令 时 ,指令 中 的 
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寄存 器 编号 被 送 到 一 个 地 址 译 码 器 进行 译 码 来 选中 某 个 寄存 器 进行 写 人 , 读 出 时 寄存 器 编 
号 作为 控制 信号 来 控制 一 个 多 路 选择 器 ,选择 相应 的 寄存 器 读 出 。 实 质 上 它 是 CPU 中 暂 
时 存放 数据 的 地 方 , 里 面 保存 着 那些 等 待 处 理 的 数据 ,或 已 经 处 理 过 的 数据 ,CPU 访问 寄存 
器 所 用 的 时 间 要 比 访问 内 存 的 时 间 短 。 采 用 寄存 器 ,可 以 减少 CPU 访问 主 存 的 次 数 ,从 而 
提高 了 CPU 的 工作 速度 。 但 因为 受到 芯片 面积 和 集成 度 的 限制 ,寄存 器 堆 的 容量 不 可 能 
很 大 。 

寄存 器 写 信 号 (Register Write) 

寄存 器 堆 中 的 寄存 器 是 由 触发 器 构成 的 ,而 触发 器 的 输出 状态 的 变化 只 能 发 生 在 时 钟 
边沿 ,因此 寄存 器 写 控制 信号 在 时 钟 边沿 有 效 。 时 钟 边 沿 到 来 时 ,事先 稳定 在 输入 端的 数据 
开始 向 寄存 器 写 人 ,经 过 一 段 时 间 延 迟 ( 这 个 延迟 时 间 称 为 Click-to-Q) 才 能 稳定 地 写 人 寄 
存 器 ,时 钟 边 沿 到 来 时 ,在 寄存 器 输出 端的 数据 还 是 上 一 个 时 钟 周期 内 的 老 数 据 。 

指令 存储 器 (Instruction Memory) 

专门 存放 指令 的 存储 器 ,也 称 为 代码 存储 器 (Code Memory) 。 实 际 上 ,现代 计算 机 中 ， 
CPU 内 的 一 级 cache 采用 数据 cache 和 代码 cache 分 离 的 方式 ,因此 指令 存储 器 实际 上 是 
CPU 中 的 代码 cache。 

数据 存储 器 (Data Memory) 

专门 存放 数据 的 存储 器 。 实 际 上 ,现代 计算 机 中 ,CPU 内 的 一 级 cache 采用 数据 cache 
和 代码 cache 分 离 的 方式 ,因此 数据 存储 器 实际 上 是 处 理 器 中 的 数据 cache。 

指令 译 码 器 (Instruction Decoder) 

用 来 对 指令 的 操作 码 进行 译 码 的 部 件 。 在 设计 指令 系统 时 ,对 每 条 功能 不 同 的 指令 操 
作 码 进行 了 编码 。 因 此 ,执行 指令 时 ,必须 要 有 相应 的 译 码 线路 对 每 个 操作 码 进 行 译 码 解 
释 。 指 令 译 码 器 的 输入 是 指令 操作 码 , 输 出 结果 用 来 和 其 他 信号 (如 时 序 信和 号、 机 器 状态 信 
号 、 指 令 结果 标志 信号 等 ) 一 起 组 合生 成 控制 信号 。 不 同 的 指令 译 码 结果 生成 不 同 的 控制 信 
息 , 以 规定 执行 部 件 做 不 同 的 动作 。 

控制 信号 (Control Signal) 

也 称 为 操作 控制 信号 或 微 操 作 信号 。 控 制 单 元 对 指令 进行 译 码 ,将 译 码 结果 和 状态 / 标 
志 信 和 号、 时 序 信号 等 进行 组 合 , 产 生 各 种 操作 控制 信号 。 这 些 控制 信号 被 送 到 CPU 内 部 或 
通过 总 线 送 到 主 存 或 I/O 模块 。 送 到 CPU 内 部 的 控制 信号 用 于 控制 CPU 内 部 数据 通路 
的 执行 , 送 到 主 存 或 IO 模块 的 信号 控制 CPU 和 主 存 或 CPU 和 1/O 模块 之 间 的 信息 
交换 。 

时 钟 周期 (Clock Cycle) 

现代 计算 机 的 CPU 采用 时 钟 信号 进行 定时 控制 。 若 采用 时 钟 边 沿 触发 , 则 只 有 时 钟 
的 上 升 沿 或 下 降 沿 到 来 此 时 ,才能 把 一 个 新 的 值 写 到 一 个 状态 单元 中 。 所 以 CPU 的 时 钟 
周期 应 该 为 所 有 相 邻 状态 单元 之 间 的 组 合 逻 辑 电 路 中 最 长 的 延 时 ,以 保证 在 一 个 时 钟 周期 
内 所 有 的 组 合 电路 能 完成 必要 的 数据 处 理工 作 。 

主 频 (CPU Clock Rate/Frequency) 

CPU 的 主 频 就 是 CPU 时 钟 周期 的 倒数 。 

分 支 条 件 满足 (Branch Taken) 

对 于 条 件 转移 指令 (分 支 指令 Branch) ,其 执行 结果 总 有 两 种 可 能 性 (两 个 分 支 或 两 条 
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执行 路 径 ) : 一 种 是 条 件 满足 ( 称 为 Branch taken) ,此 时 转 到 转移 目的 地 址 处 继续 执行 ; 另 
一 种 是 条 件 不 满足 ( 称 为 Branch not taken) ,此 时 继续 取 下 条 指令 执行 。 

转移 目标 地 址 (Branch Target Address) 

转移 指令 (包括 条 件 转移 指令 、 无 条 件 转移 指令 、 转 子 指令 等 ) 中 给 出 的 目标 地 址 称 为 转 
移 目 标 地 址 。 数 据 通 路 中 必须 要 有 相应 的 部 件 能 计算 转移 目标 地 址 ,并 根据 情况 选择 送 到 
PC 中 作为 下 一 条 执行 指令 的 地 址 。 

硬 布线 控制 器 (Hardwared Control) 

用 组 合 逻 辑 方式 进行 设计 和 实现 的 控制 器 ,也 称 为 硬 连 线路 控制 器 。 在 多 周期 数据 通 
路 中 ,一 条 指令 的 执行 分 多 个 阶段 进行 ,每 个 阶段 在 一 个 时 钟 周期 内 完成 ,如 果 把 每 个 阶段 
涉及 的 控制 信号 组 合 看 成 是 一 个 状态 , 则 一 个 阶段 转移 到 下 一 个 阶段 ,就 可 以 看 成 是 状态 之 
间 的 转换 ,因此 ,所 有 指令 的 执行 过 程 就 可 以 用 一 个 有 限 状态 机 来 描述 ,控制 器 的 功能 就 是 
实现 这 个 有 限 状 态 机 。 因 此 ,这 种 控制 器 设计 方式 也 称 为 有 限 状 态 机 方式 ,实现 的 控制 器 称 
为 有 限 状 态 机 控制 器 。 它 的 优点 是 速度 快 ,适合 实现 简单 或 规整 的 指令 系统 。 但 是 ,因为 它 
是 一 个 多 输入 /多 输出 的 巨大 的 逻辑 网 络 , 所 以 ,对 于 复杂 的 指令 系统 来 说 ,其 结构 庞杂 , 实 
现 困难 ,修改 、 维 护 不 易 , 灵 活性 差 。 

微 程序 控制 器 (Microprogrammed Control) 

采用 微 程 序 设计 方式 实现 的 控制 器 称 为 微 程序 控制 器 。 微 程序 设计 的 基本 思想 是 , 仿 
照 程序 设计 的 方法 编制 每 个 机 器 指令 对 应 的 微 程 序 , 每 个 微 程序 由 若干 条 微 指令 构成 ,每 条 
微 指 令 就 是 有 限 状 态 机 中 对 应 的 一 个 状态 , 它 是 若干 控制 信号 的 一 个 组 合 , 所 以 每 个 徽 指令 
包含 若干 微 命令 ,这 些微 命令 即 控制 信号 。 所 有 指令 对 应 的 微 指 令 序列 都 放 在 一 个 只 读 存 
储 器 中 。 当 执行 到 某 条 指令 时 ,取出 对 应 的 各 条 微 指令 , 译 码 产 生 对 应 的 微 命令 (控制 信 
号 ), 送 到 机 器 相应 的 地 方 , 控 制 其 动作 。 这 个 只 读 存储 器 称 为 控制 存储 器 (Control 
Storage,CS) ,简称 控 存 。 

微 代 码 (Microcode) 

通常 把 事先 存放 在 控制 存储 器 CS 中 的 微 程序 代码 ( 控 存 单元 中 的 0/1 序列 ) 称 为 微 代 
码 或 微 码 。 

微 指 令 (Microinstruction) 

微 指令 和 微 代码 的 含义 实际 上 是 一 样 的 ,只 是 同一 个 概念 从 不 同 的 角度 来 讲 而 已 。 
控 存 中 每 个 单元 存放 一 条 微 指令 , 对 应 于 有 限 状态 机 中 的 一 个 状态 ,每 条 微 指令 在 一 
个 时 钟 周期 内 完成 。“ 微 指令 ”与 程序 设计 中 “指令 ”的 概念 类 似 , 也 涉及 格式 和 上 顺序 控 
制 等 问题 。 

微 程序 (Microprogram) 

类 似 于 程序 设计 中 “程序 ”的 概念 ,程序 用 于 实现 某 个 特定 的 算法 功能 ,而 微 程序 用 于 实 
现 机 器 指令 ;程序 由 若干 指令 构成 ,而 微 程序 由 若干 条 微 指令 构成 :程序 存放 在 内 存 中 ,而 微 
程序 存放 在 控制 存储 器 中 。 

固件 (Firmware) 

一 般 把 写 人 EPROM 等 只 读 存 储 器 中 的 程序 称 为 固件 。 最 初 把 固化 在 只 读 存 储 器 的 
微 程 序 称 为 固件 ,表示 用 软件 实现 的 硬 部 件 , 现 在 对 固件 通俗 的 理解 就 是 在 ROM 中 “固化 
的 软件 ”。 它 是 固化 在 集成 电路 内 部 的 程序 代码 ,负责 控制 和 协调 集成 电路 的 功能 。 
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中 断 过 程 (Interrupt Processing) 

中 断 过 程 是 一 个 正常 执行 的 程序 被 打 断 的 过 程 。 指 在 程序 正常 执行 过 程 中 ,CPU 遇 到 
一 些 异常 情况 无 法 继续 执行 当前 指令 ,或 者 ,外 部 设备 发 生 一 些 特殊 事件 请 求 CPU 处 理 。 
此 时 ,CPU 中 止 原来 正在 执行 的 程序 , 转 到 处 理 异 常情 况 或 特殊 事件 的 处 理 程序 去 执行 , 执 
行 后 再 返回 到 原 被 中 止 的 程序 继续 执行 。 中 断 过 程 的 起 因 主 要 有 来 自 处 理 器 外 部 的 “中 断 ” 
和 来 自 处 理 器 内 部 的 “异常 ?两 种 。 

中 断 (Interrupt) 

引起 中 断 过 程 的 原因 之 一 。 在 程序 执行 过 程 中 , 若 外 设 完 成 任务 或 发 生 某 些 特 殊 事 件 
(如 打印 机 缺 纸 、 定 时 采样 计数 时 间 到 、 键 盘 缓冲 满 等 ), 会 向 CPU 发 中 断 请 求 , 要 求 CPU 
对 这 些 情况 进行 处 理 。 处 理 完 后 , 回 到 原 被 中 断 的 断 点 处 继续 执行 。 这 种 情况 也 被 称 为 
I/O 中 断 (I/O Interrupt) 。 特 指 由 CPU 外 部 的 IO 设备 向 CPU 发 的 中 断 请 求 。 它 与 执行 
的 指令 无 关 , 是 异步 发 生 的 外 部 事件 。 因 此 ,也 称 为 “外 部 中 断 ”。 

异常 (Exception) 

引起 中 断 过 程 的 原因 之 一 。 在 CPU 执行 某 条 指令 时 发 生 的 一 些 特 殊 的 非 正 常事 件 
(如 缺 页 溢出 、 除 数 为 0, 非法 操作 码 等 ) 都 称 为 是 一 种 异常 。 它 是 来 自 处理 器 内 部 的 意外 
事件 ,和 执行 指令 同步 发 生 。 也 称 为 “内 部 异常 "或 “内 中 断 ” 或 “程序 性 中 断 ”, 它 又 可 以 细 分 
为 3 类 : 故障 、 自 陷 、 终 止 。 

故障 (Fault) 

在 执行 某 条 指令 时 ,可 能 发 生 一 些 特殊 的 “异常 事件 >, 如 缺 页 、 溢 出、 除数 为 0. 非法 操 
作 码 等 ,使 当前 指令 无 法 继续 执行 。 此 时 CPU 只 能 中 止 原 程序 的 执行 , 转 到 处 理 相应 情况 
的 程序 去 执行 。 有 些 故 障 处 理 完 后 ,可 再 回 到 发 生 异 常 的 指令 继续 执行 ,如 缺 页 ;有 些 故障 
无 法 解决 ,只 好 终止 发 生 故 障 的 进程 。 

自 陷 (Trap》 

自 陷 是 人 为 设 定 的 事件 ,在 程序 中 事先 设 定 一 条 特殊 的 指令 ,通过 执行 这 条 特殊 指令 ， 
自动 终止 正在 执行 的 原 程序 , 转 到 一 个 特定 的 内 核 管理 程序 去 执行 ,执行 完 后 , 回 到 那 条 特 
殊 指 令 后 面 的 一 条 指令 开始 执行 。 这 种 情况 称 为 自愿 中 断 或 自 陷 (Trap)。 这 些 特殊 的 指 
令 称 为 “ 访 管 指令 ”( 访 问 管理 程序 ) 或 “ 自 陷 指令 ”( 自 动 掉 人 陷阱 ), 如 80x86 中 的 指令 
“TNT mn? 

终止 (Abort) 

既 不 是 外 部 设备 发 出 的 中 断 请 求 ,也 不 是 指令 本 身 产 生 的 异常 情况 或 自愿 中 断 , 而 是 在 
执行 指令 过 程 中 发 生 的 硬件 故障 ,如 电源 掉 电 、 线 路 故障 等 。 这 类 异常 是 随机 发 生 的 ,对 引 
起 异常 的 指令 的 确切 位 置 无 法 确定 。 出 现 这 类 严重 错误 时 ,程序 无 法 继续 执行 ,只 好 终止， 
由 中 断 服务 程序 重新 启动 操作 系统 。 

中 断 服务 程序 (Interrupt Handler) 

也 称 为 中 断 处 理 程序 .异常 处 理 程序 等 。 当 CPU 发 现 中 断 或 异常 时 ,就 会 把 当前 正在 
执行 的 用 户 程序 停 下 来 , 调 出 处 理 异 常 或 中 断 的 程序 来 执行 ,这 个 程序 就 是 中 断 服 务 程序 。 
中 断 服务 程序 属于 操作 系统 内 核 部 分 ,所 以 ,发 生 中 断 或 异常 时 ,CPU 的 状态 要 从 用 户 态 
( 即 执行 用 户 程序 的 状态 ,也 称 为 目 态 ) 切 换 到 管理 态 ( 即 执行 操作 系统 管理 程序 的 状态 ,也 
称 为 管 态 ) 。 
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异常 程序 计数 器 EPC(Exception PC) 

MIPS 处 理 器 中 用 于 保存 发 生 异 常 的 指令 或 中 断 返回 后 所 执行 指令 的 地 址 的 寄存 器 。 
它 的 位 数 和 PC 的 位 数 一 样 。 通 常 把 这 个 被 保存 的 地 址 称 为 断 点 ,把 这 个 地 址 送 到 EPC 的 
过 程 称 为 保存 断 点 。 

原因 寄存 器 (Cause Register) 

用 于 记录 异常 或 中 断 类 型 的 状态 寄存 器 。 每 一 位 的 含义 应 有 明确 规定 ,例如 : 第 一 位 
为 1 则 表示 出 现 了 “溢出 ?异常 ,第 二 位 为 1 则 表示 出 现 了 “非法 指令 ”, 第 三 位 为 1 则 是 “ 缺 
页 ”, 等 等 。 在 外 部 接口 (如 中 断 控制 器 ?中 也 有 类 似 的 状态 寄存 器 ,用 于 记录 中 断 请 求 的 类 
型 ,一 般 称 为 中 断 请 求 寄存 器 。 

中 断 允 许 触发 器 (Interrupt Enable Register) 

在 CPU 中 用 来 设置 中 断 允 许 / 中 断 禁 止 状态 的 触发 器 。 关 中 断 时 ,中 断 允 许 触发 器 被 
设置 为 0, 表 示 不 允许 响应 中 断 。 开 中 断 时 ,中 断 允许 触发 器 被 设置 为 1, 表示 人 允许 响应 
中 断 。 

关中 断 (Interrupt OFF) 

将 中 断 允 许 触发 器 设置 为 0 的 操作 ,表示 不 允许 响应 中 断 。 

开 中 断 (Interrupt ON) 

将 中 断 允 许 触发 器 设置 为 1 的 操作 ,表示 人 允许 响应 中 断 。 

中 断 向 量 (Interrupt Vector) 

每 个 中 断 源 都 有 对 应 的 处 理 程序 , 称 这 个 处 理 程序 为 中 断 服务 程 序 , 其 人 口 地 址 称 为 中 
断 向 量 。 

中 断 响 应 (Interrupt Response) 

是 指 从 CPU 发 现 有 中 断 请求 到 取出 中 断 服务 程序 的 和 人口 地 址 准备 执行 中 断 服务 程序 
的 过 程 。CPU 总 是 在 一 条 指令 执行 完 、 取 下 条 指令 之 前 去 查询 有 无 中 断 请 求 。 如 果 此 时 是 
开 中 断 状态 ,并 有 未 被 屏 项 的 中 断 请 求 发 生 , 则 CPU 自动 进入 中 断 响应 周期 ,执行 一 条 隐 
指令 ,以 完成 关中 断 \ 保 护 断 点 、 取 中 断 向 量 3 个 操作 。 

向 量 中 断 (Vector Interrupt) 

是 指 一 种 识别 中 断 源 的 技术 或 方式 。 识 别 中 断 源 的 目的 就 是 要 找到 中 断 源 对 应 的 中 断 
服务 程序 的 入口 地 址 , 即 获得 向 量 地 址 。 采 用 向 量 中 断 进行 中 断 源 识别 的 做 法 是 ,采用 某 种 
硬件 排队 线路 (如 菊花 链 、 并 行 判 优等 ) ,对 所 有 未 被 屏 项 的 中 断 请 求 进行 排队 , 选 出 优先 级 
最 高 的 中 断 源 ,然后 对 其 编码 ,得 到 该 中 断 源 的 编号 ,也 称 为 中 断 类 型 号 (可 以 转换 为 向 量 地 
址 ,有 些 书 中 就 称 其 为 向 量 地 址 ), 通 过 总 线 将 其 取 到 CPU 中 ,转换 成 向 量 地 址 ,从 而 取出 
中 断 服务 程序 人 口 地 址 ,或 跳 转 到 中 断 服务 程序 。 还 有 一 种 中 断 源 识别 方式 是 用 程序 ( 称 为 
中 断 查 询 程序 ) 进 行 识别 的 软件 方法 。 

中 断 向 量 表 (Interrupt Vector Table) 

所 有 中 断 ( 包 括 异 常 ) 的 中 断 服务 程序 人 口 地 址 构成 一 个 表 , 称 为 中 断 向 量 表 。 有 的 机 
器 把 中 断 服务 程序 人口 的 跳 转 指令 构成 一 张 表 , 称 为 中 断 向 量 跳 转 表 。 

向 量 地 址 (Vector Address) 

中 断 向 量 表 或 中 断 向 量 跳 转 表 中 每 个 表 项 所 在 的 内 存 地 址 , 称 为 向 量 地 址 。 


站 关外 理 时 - 


中 断 类 型 号 (Interrupt Number) 
中 断 向 量 表 或 中 断 向 量 跳 转 表 中 每 个 表 项 所 在 的 表 项 索引 值 , 称 为 中 断 类 型 号 。 


6.4 常见 问题 解答 


1， 从事 CPU 设计 的 人 很 少 ,为 什么 大 家 都 要 学 习 如 何 设计 CPU 呢 ? 

答 : 首先 ,从 智力 方面 来 说 ,处 理 器 设计 是 有 趣 而 富有 挑战 性 的 “现代 微 处 理 器 可 以 称 
得 上 是 人 类 创造 出 的 最 复杂 的 系统 之 一 ”",“ 处 理 器 要 完成 复杂 的 任务 ,但 又 要 求 结 构 尽 可 能 
简单 ”。 其 次 ,理解 处 理 器 如 何 工作 能 够 帮助 理解 整个 计算 机 系统 是 如 何 工 作 的 。 再 次 , 虽 
然 没 有 很 多 人 设计 处 理 器 ,但 会 有 很 多 人 从 事 骨 人 式 系统 的 设计 。 现 代 许 多 机 电 产 品 中 都 
有 处 理 器 芯片 内 人 其 中 ,其 人 式 系统 的 设计 者 必须 了 解 处 理 器 是 如 何 工作 的 ,因为 这 些 系 统 
通常 在 较 低 的 抽象 层次 上 进行 编程 设计 。 最 后 ,你 将 来 的 工作 可 能 就 是 设计 处 理 器 。( 引 自 
[ 美 ] Randal E. Bryant & David O’” Hallaron《 Computer Systems A Programmer’s 
Perspective》 第 4 章 ) 

现代 计算 机 的 处 理 器 基本 上 都 采用 流水 线 方式 执行 指令 ,流水 线 方式 的 数据 通路 比较 
复杂 ,所 以 先 从 简单 的 单 周期 数据 通路 和 多 周期 数据 通路 开始 理解 ,这 也 就 是 本 章 的 内 容 。 
有 了 这 些 基础 ,对 流水 线 处 理 器 理解 起 来 就 较 容 易 了 。 深 刻 理 解 流水 线 方式 处 理 器 的 工作 
原理 对 于 如 何 设 计 高 质量 的 程序 、 如 何 进行 编译 优化 、 如 何 设 计 高 性 能 计算 机 系统 等 都 是 非 
常 必要 的 。 

2， 一 条 指令 的 执行 过 程 包 含 哪些 操作 呢 ? 

答 : 一 条 指令 的 执行 过 程 包括 取 指 令 、 指 令 译 码 、 计 算 操 作 数 地 址 、 取 操作 数 、 运 算 、 送 
结果 。 其 中 取 指 令 和 指令 译 码 是 每 条 指令 都 必须 进行 的 操作 。 有 些 指令 需要 到 存储 单元 取 
操作 数 , 因 此 ,需要 在 取 数 之 前 计算 操作 数 所 在 的 存储 单元 地 址 。 取 操作 数 和 送 结 果 这 两 个 
步 又, 对 于 不 同 的 指令 ,其 取 和 送 的 地 方 可 能 不 同 ,有 些 指令 要 求 在 寄存 器 取 / 送 数 , 有 些 是 
在 内 存单 元 取 / 送 数 , 还 有 些 是 对 IO 端口 取 / 送 数 。 因 此 ,一 条 指令 的 执行 阶段 (不 包括 取 
指令 阶段 ) ,可 能 只 有 CPU 参与 ,也 可 能 要 通过 总 线 去 访问 主 存 , 也 可 能 要 通过 总 线 去 访问 
WO 端口 。 

3， CPU 总 是 在 执行 指令 吗 ? 会 不 会 停 下 来 什么 都 不 做 ? 

答 : CPU 的 功能 就 是 不 断 地 周而复始 地 执行 指令 ,而 每 条 指令 又 都 有 不 同 的 步骤 ,每 
个 步骤 在 一 定 的 时 间 内 完成 。 因 此 ,CPU 总 是 在 不 停 地 执行 指令 。 有 时 会 说 ,CPU 停止 或 
CPU 正在 等 待 , 什 么 事情 也 不 做 ,事实 上 ,CPU 还 是 在 执行 指令 ,只 不 过 可 能 处 于 以 下 几 种 
情况 之 一 : (1)CPU 正在 执行 某 条 指令 的 过 程 中 ,发 生 了 诸如 cache 缺失 这 样 需要 访问 内 存 
或 IO 端口 的 事件 ,此 时 , 当前 正在 执行 的 指令 无 法 继续 执行 到 下 一 步 ,因此 ,CPU 就 处 于 
等 待 状态 ,直到 主 存 或 IO 完成 读 写 操作 ; (2)CPU 正在 不 断 地 通过 执行 指令 以 查询 外 设 
是 否 就 绪 ,在 查询 过 程 中 ,CPU 什么 实质 性 的 工作 都 没有 做 ;(3)CPU 正在 执行 一 连 串 的 空 
指令 (NOP) ,什么 实质 性 工作 都 没有 做 ;等 等 。 综 上 所 述 ,CPU 不 可 能 不 在 执行 指令 ,只 是 
指令 的 执行 过 程 被 阻塞 了 一 段 时 间或 执行 了 没有 产生 结果 的 指令 。 

4. CPU 除了 执行 指令 以 外 ,还 做 什么 事情 ? 

答 : CPU 的 工作 过 程 就 是 周而复始 地 执行 指令 ,计算 机 各 部 分 所 进行 的 工作 都 是 由 
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CPU 根据 指令 的 要 求 来 启动 的 。 为 了 使 CPU 和 外 部 设备 能 够 很 好 地 协调 工作 , 尽量 使 
CPU 不 等 待 ,甚至 不 参与 外 部 设备 的 输入 和 输出 过 程 ,CPU 对 外 设 的 输入 /输出 控制 采用 
了 程序 中 断 方式 和 DMA 方式 。 这 两 种 方式 下 ,外 部 设备 需要 向 CPU 提出 中 断 请 求 或 
DMA 请 求 , 因 此 ,在 执行 指令 过 程 中 ,CPU 还 要 通过 定时 采样 相应 的 引 脚 来 查询 有 没有 中 
断 请 求 或 DMA 请 求 。 如 果 有 中 断 请 求 ,CPU 要 进行 一 系列 操作 来 完成 从 正在 执行 的 用 户 
程序 到 中 断 处 理 程序 的 切换 ;如 果 有 DMA 请 求 ,还 要 给 出 响应 DMA 请 求 的 一 些 控制 信 
号 。 另 外 ,CPU 在 一 条 指令 的 执行 过 程 中 ,还 可 能 发 生 一 些 异常 事件 ,因此 ,也 需要 CPU 能 
道 过 相应 的 动作 ,转换 到 异常 事件 处 理 程序 去 执行 。 

5， 对 于 CPU 中 的 所 有 寄存 器 ,用 户 都 能 访问 吗 ? 

答 : 不 是 的 。CPU 中 的 寄存 器 分 为 用 户 可 访问 寄存 器 和 用 户 不 可 见 寄存 器 。 一 般 把 
用 户 可 访问 寄存 器 称 为 通用 寄存 器 (GPR)。 这 些 寄 存 器 都 有 一 个 编号 ,在 指令 中 用 编号 标 
识 寄存 器 。 因 此 执行 指令 时 ,指令 中 的 寄存 器 编号 要 送 到 一 个 地 址 译 码 器 进行 译 码 ,然后 才 
能 选中 某 个 寄存 器 进行 读 写 。 通 用 寄存 器 可 以 用 来 存放 操作 数 或 运算 结果 ,或 作为 地 址 指 
针 、 变 址 寄存 器 、 基 址 寄存 器 等 。 

CPU 中 有 一 些 寄存 器 是 用 户 不 可 见 的 ,没有 编号 ,不 能 通过 程序 直接 访问 。 如 指令 寄 
存 器 及 \ 程 序 状态 字 寄 存 器 PSWR、 存 储 器 地 址 寄存 器 MAR、 存 储 器 数据 寄存 器 MDR 等 。 

对 于 程序 计数 器 PC, 它 虽然 是 专用 寄存 器 ,没有 编号 ,不 能 在 指令 中 被 明确 指定 ,但 用 
户 可 以 通过 转移 类 指令 来 修改 其 值 ,以 改变 程序 执行 的 顺序 。 因 此 某 种 程度 上 PC 属于 用 
户 可 见 寄存 器 。 

6，CPU 执行 指令 的 过 程 中 ,其 他 部 件 在 做 什么 ? 

答 : 计算 机 的 工作 过 程 就 是 连续 执行 指令 的 过 程 , 整 个 计算 机 各 个 部 分 的 动作 都 是 由 
CPU 中 的 控制 部 件 CU 通过 对 指令 译 码 送出 的 控制 信号 来 控制 的 。 其 他 部 件 不 知道 自己 
该 做 什么 ,该 完成 什么 动作 ,只 有 CPU 通过 对 指令 译 码 才 知 道 。 如 果 指 令 中 包含 对 存储 器 
或 IO 端口 的 访问 , 则 必须 由 CPU 通过 总 线 , 把 要 访问 的 地 址 和 操作 命令 ( 读 / 写 ) 等 信息 
送 到 存储 器 或 I/O 接口 来 启动 相应 的 读 或 写 操作 。 例 如 , 若 不 采用 cache, 则 每 次 指令 执行 
前 ,都 要 通过 向 总 线 发 出 主 存 地 址 、 主 存 读 命令 等 来 控制 存储 器 取 指 令 ; 若 当前 执行 的 是 寄 
存 器 定点 加 法 指令 , 则 CU 控制 定点 运算 器 进行 动作 :若是 IO 指令 , 则 CU 会 通过 总 线 发 
出 I/O 端口 地 址 、I/O 读 或 写 命令 等 来 控制 对 某 个 I/O 接口 中 的 寄存 器 进行 读 写 操作 。 所 
以 说 ,CPU 在 执行 指令 时 ,其 他 部 件 也 可 能 在 执行 同样 的 指令 ,只 不 过 它们 各 司 其 职 : CU 
负责 解释 指令 和 发 出 命令 (控制 信号 ,而 各 个 执行 部 件 负责 按 命令 具体 完成 自己 的 职责 (如 
读 写 数据 传送 信息 等 ) 。 

7. 怎样 保证 CPU 能 按 程序 规定 的 顺序 执行 指令 呢 ? 

答 : 计算 机 的 工作 过 程 就 是 连续 执行 指令 的 过 程 ,指令 在 主 存 中 连续 存放 。 一 般 情况 
下 ,指令 被 顺序 执行 ,只 有 遇 到 转移 指令 (如 无 条 件 转移 .条 件 分 支 ` 调 用 和 返回 等 指令 ) 才 不 
按 指令 存放 的 顺序 执行 。 当 执行 到 非 转移 指令 时 ,CPU 中 的 指令 译 码 器 通过 对 指令 译 码 ， 
知道 正在 执行 的 是 一 种 顺序 执行 的 指令 ,所 以 就 直接 通过 对 PC 加 “1”( 这 里 的 1” 是 指 一 条 
指令 的 长 度 ) 来 使 PC 指向 下 一 条 顺序 执行 的 指令 ; 当 执行 到 转移 指令 时 ,指令 译 码 器 知道 
正在 执行 的 是 一 种 转移 指令 ,因而 ,控制 运算 器 进行 相应 的 地 址 运算 ,把 运算 得 到 的 转移 目 
标 地 址 送 到 PC 中 ,使 得 执行 的 下 一 条 指令 为 转移 到 的 目标 指令 。 
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由 此 可 以 看 出 ,指令 在 主 存 中 的 存放 顺序 是 静态 的 ,而 指令 的 执行 顺序 是 动态 的 。 
CPU 能 根据 指令 执行 的 结果 动态 改变 程序 的 执行 流程 。 

8. 在 定 长 指令 字 格 式 的 处 理 器 中 ,如 何 读 取 指 令 ? 

答 : 定 长 指令 字 格 式 是 一 种 规整 型 指令 集 , 所 有 指令 都 有 相同 的 长 度 , 所 以 ,指令 的 读 
取 非 常 简单 。 每 次 都 可 以 按照 确定 的 字 节 个 数 从 指令 存储 器 读 出 指令 。 

9， 在 定 长 指令 字 格 式 的 处 理 器 中 ,下 一 条 指令 地 址 如 何 计算 ? 

答 : 定 长 指令 字 格 式 是 一 种 规整 型 指令 集 , 所 有 指令 都 有 相同 的 长 度 。 现 代 计 算 机 大 
多 以 字 节 编 址 ,因此 ,在 计算 下 条 指令 的 地 址 时 ,只 要 将 PC 中 的 当前 指令 地 址 加 上 指令 的 
字 节 数 就 行 了 。 如 MIPS 处 理 器 的 指令 字 都 是 32 位 ,所 以 ,每 条 MIPS 指令 占 了 4 个 内 存 
单元 。 只 要 将 PC 的 值 加 4 就 可 以 得 到 下 条 指令 的 地 址 。 

10. 在 变 长 指令 字 格 式 的 处 理 嚣 中, 如何 读 取 指 令 ? 

答 : 变 长 指令 字 格 式 是 一 种 不 规整 型 指令 集 , 指 令 有 长 有 短 , 每 条 指令 所 含 的 字 节 数 不 
同 。 因 此 ,在 取 当 前 指令 时 ,可 以 每 次 按 最 长 的 指令 长 度 来 取 。 例 如 ,如 果 最 长 指令 长 度 为 
6, 则 每 次 取 6 个 字 节 ,然后 根据 指令 中 特定 位 的 规定 ,对 指令 中 的 各 字段 进行 划分 ,确定 指 
令 包含 的 操作 码 字段 .寄存 器 编码 字段 .立即 数字 段 .直接 地 址 字段 或 转移 目标 地 址 字段 等 。 
因为 总 是 按 最 长 指令 字 读 取 , 所 以 每 条 指令 总 是 包含 在 读 出 的 字 节 中 。 

11. 在 变 长 指令 字 格 式 的 处 理 器 中 ,下 一 条 指令 地 址 如 何 计 算 ? 

答 : 变 长 指令 字 格 式 是 一 种 不 规整 型 指令 集 ,指令 有 长 有 短 , 每 条 指令 所 含 的 字 节 数 不 
同 。 因 此 ,在 计算 下 条 指令 的 地 址 时 ,应 将 当前 指令 地 址 (PC 的 内 容 ) 加 上 当前 指令 的 字 节 
数 。 例 如 : 80x86 处 理 器 的 指令 字 是 变 长 的 ,每 条 指令 从 一 个 字 节 到 多 个 字 节 不 等 。 因 此 ， 
下 条 指令 地 址 通过 一 个 专门 的 PC 增 量 器 来 进行 计算 ,这 个 PC 增 量 器 能 根据 指令 中 相关 字 
段 的 值 , 确 定 PC 应 该 加 几 。 

12. 从 处 理 器 设计 的 角度 ,你 认为 定 长 指令 字 好 还 是 变 长 指令 字 好 ? 

答 : 从 处 理 器 设计 的 角度 来 看 , 定 长 指令 字 格 式 比 变 长 指令 字 格 式 要 好 。 特 别 是 在 
取 指 令 操 作 和 计算 下 条 指令 地 址 方面 , 定 长 指令 字 可 以 大 大 简化 处 理 器 中 取 指 令 部 件 的 
设计 。 

13. CPU 的 主 频 越 高 ,运算 速度 就 越 快 吗 ? 

答 : CPU 中 的 执行 部 件 ( 定 点 运算 部 件 、 浮 点 运算 部 件 ) 的 每 一 步 动 作 都 要 有 相应 的 控 
制 信号 进行 控制 ,这些 控制 信号 何 时 发 出 \ 作 用 时 间 多 长 ,都 要 有 相应 的 时 钟 定时 信号 进行 
同步 ,CPU 的 主 频 就 是 同步 时 钟 信号 的 频率 。 

从 直观 上 看 , 主 频 越 高 ,每 一 步 的 动作 就 越 快 ,CPU 的 运算 速度 也 就 越 快 。 例 如 , 若 两 
台 具 有 相同 ISA 的 机 器 的 CPI 都 为 2, 则 主 频 为 500MHz 的 机 器 在 一 秒 钟 内 执行 2.5 亿 条 
指令 ;而 主 频 为 1GHz 的 机 器 在 一 秒 钟 内 执行 5 亿 条 指令 。 显 然 主 频 越 高 指令 执行 速度 
越 快 。 

主 频 是 反映 CPU 性 能 的 重要 指标 ,但 它 只 反映 一 个 侧面 ,而 不 是 绝对 的 速度 指标 。 对 
于 具有 不 同 ISA 和 不 同 CPI 的 两 台 计 算 机 ,不 能 简单 地 根据 主 频 来 衡量 运算 速度 。 例 如 ， 
如 果 将 一 条 指令 所 包含 的 操作 步骤 分 得 很 多 ,使 每 一 步 操作 所 用 时 间 很 短 ,那么 ,定时 用 的 
时 钟 周期 就 很 短 , 因 而 主 频 就 高 ,但 是 ,此 时 CPI 也 变 大 了 ,因而 执行 一 条 指令 的 时 间 并 没 
有 缩短 。 
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14. CPU 中 的 控制 器 的 功能 是 什么 ? 

答 : CPU 中 的 控制 器 主要 用 于 产生 执行 各 条 指令 所 需要 的 控制 信号 。 有 两 大 类 控制 
信号 : CPU 内 部 控制 信号 和 发 送 到 系统 总 线 上 的 控制 信号 。 

1S， 数据 通路 的 功能 是 什么 ? 

答 : CPU 的 基本 功能 就 是 执行 指令 ,指令 的 执行 过 程 就 是 数据 在 数据 通路 中 流动 的 过 
程 。 数 据 在 流动 过 程 中 ,要 经 过 一 些 执 行 部 件 进行 相应 的 处 理 ,处 理 后 的 数据 要 送 到 存储 部 
件 保 存 。 简 而 言 之 ,数据 通路 的 功能 就 是 通过 对 数据 进行 处 理 、 存 储 和 传输 来 完成 指令 的 
执行 。 

16， 数据 通路 是 如 何 进行 数据 处 理 、 数 据 传送 、 数 据 存储 的 ? 

答 : 数据 通路 中 的 功能 部 件 包括 两 种 不 同 的 逻辑 单元 : 进行 数据 处 理 的 组 合 逻 辑 单元 
(操作 元 件 ) 和 进行 数据 存储 的 时 序 逻 辑 单元 (状态 单元 ) 。 组 合 逻 辑 单元 的 输出 只 取决 于 当 
前 的 输入 ,也 就 是 说 输入 一 旦 改变 ,在 一 定 的 线路 延迟 后 ,输出 就 跟着 变化 ,因而 它 只 能 完成 
一 定 的 数据 处 理 功 能 ,不 能 存储 数据 ,只 有 将 处 理 后 的 新 数据 送 到 一 个 状态 单元 才能 保存 下 
来 。 所 以 ,所 有 的 数据 处 理 单元 都 必须 将 处 理 后 的 输出 结果 写 到 状态 单元 中 ,而 在 处 理 前 又 
必须 从 状态 单元 接收 输入 。 因 此 ,数据 流动 的 起 点 是 状态 单元 ,经 过 一 些 组 合 逻 辑 部 件 ,最 
终 又 流 回 状态 单元 保存 。 功 能 部 件 之 间 的 输入 /输出 信息 通过 连 线 进行 传送 。 

17. 数据 通路 中 流动 的 信息 有 哪些 ? 

答 : 指令 的 执行 过 程 就 是 数据 通路 中 信息 的 流动 过 程 。 因 此 要 理解 数据 通路 中 流动 的 
信息 类 型 ,必须 先 考察 指令 的 执行 过 程 。 因 为 每 条 指令 的 功能 不 同 ,所 以 其 执行 过 程 也 不 一 
样 。 但 总 体 来 说 ,指令 执行 过 程 中 涉及 的 基本 操作 包括 取 指 令 并 送 指令 寄存 器 .计算 下 一 条 
指令 地 址 、 下 条 指令 地 址 送 PC、 取 寄存 器 数据 到 ALU 输入 端 ,指令 中 的 立即 数 送 扩 展 器 或 
ALU 输入 端 .ALU 中 进行 运算 (包括 计算 内 存单 元 地 址 ) 读 内 存 数据 到 寄存 器 、 寄 存 器 数 
据 写 到 内 存 、.ALU 输出 写 到 寄存 器 等 。 因 此 ,在 数据 通路 中 流动 的 信息 有 PC 的 值 、 指 令 、 
指令 中 的 立即 数 、 指 令 中 的 寄存 器 编号 寄存 器 中 的 操作 数 、ALU 运算 的 结果 、 内 存单 元 中 
的 操作 数 等 。 

18. 控制 信号 是 如 何 控 制 数 据 的 流动 的 ? 

答 : 指令 的 执行 过 程 就 是 数据 通路 中 信息 的 流动 过 程 。 数 据 通 路 中 信息 的 流动 受 控 制 
信号 的 控制 。 当 前 指令 被 取 到 指令 寄存 器 IR 后 ,指令 的 操作 码 部 分 被 送 到 指令 译 码 器 进 
行 译 码 ,指令 译 码 输出 的 信号 和 其 他 信号 一 起 组 合 后 生成 控制 信号 。 所 以 不 同 的 指令 得 到 
不 同 的 控制 信号 ,以 规定 数据 通路 完成 不 同 的 信息 流动 过 程 。 在 数据 通路 中 ,各 个 功能 部 件 
中 都 有 一 些 控制 点 ,这些 控制 点 接受 不 同 的 控制 信号 ,就 使 得 功能 部 件 完成 不 同 的 操作 。 例 
如 : ALU 的 操作 控制 点 接受 “Add”、“Sub”、“And”“Or” 等 不 同 的 操作 信号 ,控制 ALU 完 
成 加 、 减 、 与 或 等 不 同 的 操作 。Load/Store 指令 译 码 后 把 “Add” 信 号 送 到 ALU 控制 点 , 控 
制 ALU 进行 加 法 运算 来 计算 内 存单 元 的 地 址 。 再 例如 : 有 些 状态 单元 的 写 人 操作 由 一 个 
“ 写 控制 信号 ?来 控制 ,如 果 某 条 指令 不 需要 把 信息 写 人 寄存 器 或 内 存单 元 ,那么 ,这 条 指令 
对 应 的 译 码 信号 就 使 这 个 “ 写 控制 信号 无效, 从 而 控制 不 写 人 任何 信息 。 

19， 如 何 保证 一 条 指令 执行 过 程 中 的 操作 按 序 执行 ? 

答 : 对 于 每 条 指令 来 说 ,其 执行 过 程 应 该 是 有 序 的 。 例 如 : 对 于 运算 类 指令 ,其 操作 数 
一 定 要 先 取 出 来 才能 进行 运算 ,运算 结果 一 定 是 在 最 后 才能 写 到 目的 寄存 器 中 。 对 于 


光头 外 再 可 。 


Load/Store 型 指令 一 定 是 先 取出 源 寄 存 器 的 值 ,并 先 对 立即 数 进行 符号 扩展 ,然后 才能 把 
它们 送 到 ALU 相 加 ,计算 出 内 存单 元 的 地 址 ,随后 再 访问 内 存单 元 取 数 或 存 数 。 因 而 必须 
有 一 个 机 制 来 控制 一 条 指令 的 有 序 执行 ,那么 ,如 何 控制 呢 ? 主要 是 通过 将 指令 执行 的 每 一 
步 按 序 送 到 相应 的 组 合 逻 辑 处 理 部 件 和 存储 信息 的 状态 元 件 。 在 每 个 时 钟 周期 中 ,组 合 逻 
辑 部 件 在 相应 的 控制 信号 的 控制 下 进行 数据 处 理 或 数据 传送 ,而 在 时 钟 有 效 信号 到 达 时 状 
态 单元 保存 中 间 结 果 。 这 样 , 经 过 若干 个 时 钟 周期 ,一 条 指令 就 在 数据 通路 中 执行 完成 了 。 

20， 多 路 选择 器 的 作用 与 工作 原理 是 什么 ? 

答 : 多 路 选择 器 也 称 数据 选择 器 或 多 路 复 用 器 。 它 的 作用 就 是 在 多 个 输入 中 选择 其 中 
的 一 个 作为 输出 。 因 此 , 它 有 多 个 输入 端 一 个 输出 端 和 一 个 控制 端 。 控 制 端的 控制 信号 位 
数 由 输入 端的 个 数 确 定 ,2 选 1 时 ,控制 信号 有 1 位 ,根据 控制 信号 为 0 还 是 1, 决 定 将 输入 
端 1 还 是 2 作为 输出 。3 选 1 或 4 选 1 时 ,控制 信号 有 2 位 ,根据 控制 信号 为 00、01、10 还 是 
11, 决 定 将 输入 端 1.2、3 或 4 作为 输出 。 

21. 加 法 器 (Adder) 和 ALU 的 差别 是 什么 ? 

答 : 加 法 器 只 能 实现 两 个 输入 的 相 加 运算 ,而 ALU 可 以 实现 多 种 算术 逻辑 运算 。 可 以 
用 门 电路 直接 实现 加 法 器 ,也 可 以 通过 对 ALU 的 操作 控制 端 固定 设置 为 “加 ”操作 来 实现 
加 法 器 。 在 数据 通路 中 有 些 地 方 只 需 做 加 法 运算 ,如 地 址 计算 时 ,这 时 就 不 需要 用 ALU', 只 
要 用 一 个 加 法 器 即 可 。 

22， 指令 存储 器 和 数据 存储 器 的 差别 是 什么 ? 

答 : 指令 存储 器 和 数据 存储 器 的 功能 不 一 样 ,指令 存储 器 专门 用 来 存放 指令 ,而 数据 
存储 器 专门 存放 数据 。 所 以 ,从 指令 执行 过 程 来 看 ,指令 存储 器 只 在 取 每 条 指令 时 执行 
读 操作 ,每 个 指令 周期 都 一 样 ,而 数据 存储 器 只 有 在 执行 访 存 指令 时 才 被 访问 ,而 且 不 仅 
可 能 有 读 操作 也 可 能 有 写 操作 。 指 令 存 储 器 的 读 地 址 由 PC 提供 ,而 数据 存储 器 的 读 地 
址 和 写 地 址 都 由 ALU 的 输出 端 提供 ,因为 数据 的 地 址 需要 通过 基 址 和 偏 移 量 相 加 得 到 。 
数据 存储 器 的 写 操作 需要 一 个 写 控制 信号 ( 写 使 能 信号 Write Enable) 进行 控制 。 在 现代 
计算 机 中 ,CPU 内 的 一 级 cache 采用 数据 cache 和 指令 cache 分 离 的 方式 ,所 以 指令 存储 
器 实际 上 是 处 理 器 中 的 指令 cache, 数 据 存储 器 实际 上 是 处 理 器 中 的 数据 cache。 从 这 点 
来 看 ,指令 存储 器 和 数据 存储 器 的 基本 实现 应 该 是 一 样 的 ,都 是 遵循 cache 设计 的 一 套 方 
法 来 实现 的 。 

23. 如 何 确定 CPU 的 时 钟 周期 ? 

答 : 在 一 个 边沿 触发 的 同步 数字 系统 中 ,一 个 状态 量 的 改变 总 是 在 时 钟 的 上 升 沿 或 下 
降 沿 发 生 , 称 上 升 沿 或 下 降 沿 的 到 来 为 时 钟 有 效 信 号 到 达 。 一 个 状态 量 的 改变 必须 满足 以 
下 3 个 条 件 : (1) 新 写 人 的 数据 已 经 生成 并 稳定 在 状态 单元 的 输入 端 ; (2) 写 使 能 信号 有 效 ， 
(3) 时 钟 有 效 信号 到 达 。 在 前 面 两 个 条 件 满足 的 情况 下 ,一旦 时 钟 有 效 信号 到 达 , 则 输入 数 
据 开 始 写 人 状态 单元 ,经 过 一 定 的 延迟 后 ,状态 单元 的 输出 变 为 新 输入 的 数据 。 所 以 要 能 使 
电路 正确 工作 ,必须 使 新 写 人 的 数据 在 时 钟 有 效 信号 到 达 前 稳定 在 输入 端 ,即时 钟 周期 必须 
足够 长 ,使 得 在 状态 单元 之 间 进 行 数 据 处 理 的 组 合 逻辑 电路 有 足够 的 时 间 来 得 到 新 的 数据 。 
所 以 ,应 该 以 所 有 相 邻 状态 单元 之 间 的 组 合 逻 辑 电 路 中 最 长 的 延 时 为 基准 来 确定 时 钟 周期 ， 
以 保证 在 一 个 时 钟 周期 内 所 有 的 组 合 电路 能 完成 必要 的 数据 处 理工 作 , 在 下 一 个 时 钟 到 来 
后 ,数据 能 存储 在 状态 单元 中 。 
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24， 如 何 确 定单 周期 数据 通路 的 时 钟 周期 ? 

答 : 单 周期 数据 通路 指 每 条 指令 的 执行 在 一 个 时 钟 周期 内 完成 , 即 CPI 二 1。 因 此 ,在 
单 周 期 数据 通路 中 ,每 当 一 个 时 钟 有 效 边 沿 到 来 时 ,开始 一 条 指令 的 执行 ,所 有 指令 都 要 求 
在 一 个 时 钟 周期 内 完成 ,下 一 个 时 钟 有 效 边沿 到 来 时 ,上 一 个 时 钟 周期 完成 的 指令 的 结果 被 
写 到 目的 寄存 器 或 存储 器 中 ,同时 上 一 个 时 钟 周 期 内 计算 出 指令 的 地 址 被 输入 PC, 一 段 时 
间 (Click-to-Q) 延 迟 后 ,PC 的 值 被 送 到 指令 存储 器 ,开始 取 指 令 并 执行 。 所 以 , 单 周期 数据 
通路 的 时 钟 周期 应 该 以 最 复杂 的 指令 所 需要 的 执行 时 间 为 准 来 确定 ,以 保证 所 有 指令 都 能 
在 一 个 时 钟 周 期 内 完成 。 因 为 单 周 期 数据 通路 中 指令 的 执行 结果 总 是 在 下 一 个 时 钟 到 来 时 
才 被 写 到 状态 单元 ,所 以 ,整个 指令 执行 过 程 都 是 在 组 合 逻 辑 电 路 中 进行 的 ,没有 中 间 结 果 
需要 保存 。 以 MIPS 中 复杂 的 lw 指令 为 例 ,一 个 时 钟 的 长 度 应 该 包括 PC 锁 存 时 间 (PC?s 
Clock-to-Q) 、 取 指 时 间 (Instruction Memory Access Time)、 寄 存 器 堆 存 取 时 间 (Register 
File Access Time)、ALU 延 时 (CALU Delay)、 数 据 存 取 时 间 (Data Memory Access Time)、 
寄存 器 建立 时 间 (Register File Setup Time) 和 时 钟 偏 移 (Clock Skew) 。 

25， 单 周 期 数据 通路 中 ,控制 信号 何 时 发 出 ? 

答 : 单 周期 数据 通路 中 ,每 条 指令 在 一 个 周期 内 完成 ,所 有 控制 信号 同时 产生 ,在 指令 
取出 后 ,指令 操作 码 字段 及 相关 的 控制 字段 送 到 控制 逻辑 ,由 控制 逻辑 统一 得 到 各 个 控制 信 
号 ,每 个 控制 信号 被 送 到 相应 的 控制 点 ,一 直 作 用 在 数据 通路 中 , 直到 下 一 条 指令 执行 过 程 
中 产生 新 的 控制 信号 。 例 如 : 假定 作用 在 ALU 上 的 控制 信号 ALUCtrl 为 “001” 时 , ALU 
做 加 法 ;为 “010” 时 ,做 减法 ;为 “011” 时 做 “与 ”操作 ;…*… ,那么 ,执行 加 法 指令 “Add” 时 , 操 
作 信 号 ALUCtrl 一 直 以 “001” 作 用 在 ALU 的 操作 控制 端 上 , 若 下 一 条 为 减法 指令 “Sub”， 
则 该 指令 被 取出 译 码 后 从 控制 逻辑 送出 的 ALUCtrl 信号 的 取 值 就 变 为 "010”, 在 执行 减法 
过 程 中 ,操作 信号 ALUCtrl 一 直 以 “010” 作 用 在 ALU 的 操作 控制 端 上 。 

26， 如 何 确定 多 周期 数据 通路 的 时 钟 周期 ? 

答 : 多 周期 数据 通路 通过 把 指令 的 执行 分 成 多 个 阶段 来 实现 , 即 CPI 关 1。 规 定 每 
个 阶段 在 一 个 时 钟 周期 内 完成 ,时 钟 周 期 以 最 复杂 的 阶段 所 花 时 间 为 准 ,阶段 的 划分 
原则 是 : 将 一 条 指令 的 执行 过 程 尽 量 分 成 大 致 相等 的 若干 阶段 。 这 样 , 可 以 使 得 时 钟 
周期 尽量 短 。 

在 多 周期 数据 通路 中 ,一 条 指令 的 执行 由 多 个 时 钟 周期 来 控制 。 不 同 的 指令 所 含 的 时 
钟 周期 数 不 同 。 复 杂 指 令 所 含 的 时 钟 数 多 于 简单 指令 的 时 钟 数 。 

27. 多 周期 数据 通路 中 ,控制 信号 何 时 发 出 ? 

答 : 多 周期 数据 通路 中 ,每 条 指令 的 执行 分 成 若干 个 阶段 完成 ,每 来 一 个 时 钟 ,就 进入 
到 下 一 个 阶段 。 因 为 在 数据 通路 中 每 个 不 同 的 阶段 将 完成 不 同 的 功能 ,所 以 控制 信号 在 每 
个 时 钟 到 来 时 改变 其 值 。 因 此 ,和 单 周 期 数据 通路 不 同 ,多 周期 数据 通路 中 ,同一 个 控制 信 
号 在 一 个 指令 周期 中 可 能 多 次 改变 其 值 。 

28. 为 什么 很 少 有 机 器 采用 单 周 期 数据 通路 ? 

答 : 因为 单 周 期 数据 通路 以 最 复杂 指令 所 需 时 间 为 标准 来 设计 时 钟 周期 ,每 条 指令 的 
执行 时 间 都 一 样 ,是 极 大 的 浪费 。 

29. 单 周 期 处 理 器 的 基本 设计 步骤 是 什么 ? 

答 : 处 理 器 的 设计 是 一 个 相当 复杂 的 过 程 ,设计 者 必须 在 集成 电路 技术 、 指 令 集体 系 结 


天 站 更 吕 - 


构 、 计 算 机 性 能 评价 等 方面 具有 丰富 的 知识 和 相当 的 经 验 。 但 不 管 有 多 复杂 ,其 基本 步 又 可 
以 归纳 为 以 下 几 步 : (1) 分 析 每 条 指令 的 功能 ,并 用 某 种 形式 化 方法 (如 RTI-Register 
Transfer Language) 来 表示 。(2) 根 据 指令 的 功能 确定 所 需要 的 元 件 , 并 考虑 如 何 将 它们 互 
连 。 各 部 件 互 连 后 的 电路 就 是 数据 通路 。(3) 确 定 每 个 元 件 所 需要 的 控制 信号 的 取 值 。 
(4) 汇 总 所 有 指令 所 涉及 的 控制 信号 ,生成 一 张 反映 指令 与 控制 信号 之 间 关 系 的 表 。(5) 根 
据 关系 表 得 到 每 个 控制 信号 的 逻辑 表达 式 , 据 此 设计 控制 器 电路 。 

30， 控制 器 有 了 哪 两 种 实现 方式 ? 各 有 何 优 缺点 ? 

答 : 有 两 种 实现 方式 : (1) 用 组 合 逻辑 设计 方式 实现 硬 连 线路 控制 器 。(2) 用 微 程 序 设 
计 方 式 实现 微 程序 控制 器 。 硬 连 线路 控制 器 的 优点 是 速度 快 ,适合 实现 简单 或 规整 的 指令 
系统 。 但 是 , 它 是 一 个 多 输入 /多 输出 的 巨大 的 逻辑 网 络 。 对 于 复杂 的 指令 系统 来 说 , 其 结 
构 庞 杂 , 实 现 困难 ,修改 、 维 护 不 易 ,灵活 性 差 。 微 程序 控制 器 的 特点 是 具有 规整 性 、 可 维 性 
和 灵活 性 ,但 速度 慢 。 为 了 结合 两 种 方式 的 优点 ,很 多 处 理 器 采用 两 者 结合 的 方式 来 实现 。 
例如 : Intel 80x86 系统 中 综合 使 用 了 硬 布线 来 处 理 简 单 指令 ,用 微 程序 方式 ( 微 码 ) 实 现 复 
杂 指 令 。 

31. 如 何 用 组 合 逻 辑 设计 方式 实现 硬 连 线路 控制 器 ? 

答 : 用 组 合 逻辑 设计 方式 实现 硬 连 线 路 控制 器 ,也 称 为 基于 有 限 状 态 机 方式 。 其 基本 
思想 是 将 所 有 指令 执行 的 每 个 阶段 (一 个 时 钟 周期 内 ?所 包含 的 控制 信号 的 取 值 作为 一 个 状 
态 ,每 来 一 个 时 钟 , 则 进入 下 一 个 阶段 对 应 的 状态 ,每 个 状态 对 应 一 组 控制 信和 号 。 

这 样 ,每 条 指令 的 执行 过 程 就 由 有 限 状 态 机 的 每 个 状态 中 包含 的 控制 信号 来 控制 。 因 
此 ,控制 器 的 设计 也 就 是 考虑 怎样 使 得 控制 器 每 来 一 个 时 钟 就 从 当前 状态 进入 到 下 一 状态 ， 
状态 的 改变 又 使 得 控制 信号 的 值 发 生 改 变 。 有 限 状 态 机 控制 器 通常 由 一 个 组 合 逻 辑 电路 模 
块 和 一 个 状态 寄存 器 组 成 。 状 态 寄 存 器 如 何 变化 是 由 当前 状态 和 当前 指令 决定 的 ,而 组 合 
逻辑 控制 模块 可 以 由 一 个 ROM 或 一 个 PLA 实现 。 

32， 微 程序 控制 器 设计 的 基本 思想 是 什么 ? 

答 : 仿照 程序 设计 的 方法 编制 每 个 机 器 指令 对 应 的 微 程序 ,每 个 微 程序 由 若干 条 微 指 
令 构 成 ,各 微 指令 包含 若干 条 微 命令 。 所 有 指令 对 应 的 微 程序 放 在 只 读 存储 器 中 。 当 执行 
到 某 条 指令 时 ,取出 对 应 的 微 程序 中 的 各 条 微 指令 ,并 对 微 指 令 译 码 产 生 对 应 的 微 命令 ( 控 
制 信号 ), 送 到 机 器 相应 的 地 方 ,控制 其 动作 。 

33. 有 哪 几 种 微 指 令 格式 设计 风格 ? 

答 : 微 指 令 格式 设计 有 两 种 风格 : 一 种 是 水 平 型 微 指令 ,面向 内 部 控制 逻辑 的 描述 , 包 
括 不 译 法 (直接 控制 法 )、 字 段 直接 编码 ( 译 )? 法 .字段 间接 编码 ( 译 ? 法 。 其 基本 思想 是 把 能 同 
时 执行 的 微 命令 尽量 多 地 安排 在 一 条 微 指令 中 。 通 常 把 能 同时 执行 的 微 命令 称 为 相 容 微 命 
令 。 这 种 微 指令 格式 的 微 程 序 短 , 微 命令 并 行 性 高 ,适合 较 高 速度 的 应 用 场合 。 但 缺点 是 微 
指令 长 ,编码 空间 利用 率 较 低 ,并 且 编 制 较为 困难 。 另 一 种 是 垂直 型 微 指令 ,面向 算法 描述 ， 
也 称 为 最 小 (或 最 短 、 垂 直 ) 编 码 ( 译 ) 法 。 其 基本 思想 是 借鉴 指令 编码 的 思想 ,使 得 一 条 微 指 
令 只 包含 一 两 个 微 命令 。 这 种 风格 的 微 指令 短 ,编码 效率 高 ,格式 与 机 器 指令 类 似 , 故 编制 
容易 。 其 缺点 是 微 程序 长 ,一 条 微 指令 只 包含 一 两 个 微 命令 ,无 并 行 , 因 而 速度 慢 。 

34. 如 何 找到 指令 对 应 的 第 一 条 微 指令 ? 

答 : 控 存 中 存放 着 所 有 指令 对 应 的 微 程序 ,因而 控 存 中 有 成 百 上 千 条 微 指令 。 每 一 条 指 
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令 执行 时 ,必须 找到 这 条 指令 对 应 微 程序 所 包含 的 微 指令 序列 中 的 第 一 条 微 指令 ,然后 按 一 定 
的 顺序 执行 这 个 微 指令 序列 ,每 个 时 钟 执行 一 条 微 指 令 。 那 么 ,如 何 找 到 对 应 的 第 一 条 微 指令 
呢 ? 通常 一 条 指令 的 执行 总 是 从 取 指令 开始 ,在 取出 指令 之 后 进行 指令 译 码 ,可 以 用 ROM 或 
PLA 来 实现 一 个 调度 表 , 其 人 口 为 指令 译 码 输入 ,而 输出 为 每 条 指令 对 应 的 微 指令 序列 的 首 
条 微 指令 在 控 存 中 的 地 址 。 根 据 这 个 地 址 到 控 存 中 取出 第 一 条 微 指令 执行 即 可 。 

35， 如 何 控制 微 指 令 的 执行 顺序 ? 

答 : 在 找到 指令 对 应 的 首 条 微 指令 后 ,就 可 以 按照 一 定 的 顺序 来 执行 指令 对 应 的 微 指 
令 序 列 。 那 么 ,如 何 控制 处 理 器 按照 正确 的 顺序 执行 微 指 令 序 列 呢 ? 这 就 是 徽 指令 定 序 器 
的 实现 问题 。 可 以 有 两 种 方式 来 确定 下 条 微 指令 地 址 : 计数 器 法 ( 增 量 法 ) 和 下 址 字段 法 
(断定 法 )。 

计数 器 法 的 基本 思想 : 借鉴 指令 定 序 器 的 实现 思路 ,用 一 个 专门 的 计数 器 (通常 称 为 微 
程序 计数 器 pyPC, 对 应 于 程序 计数 器 PC) 来 指定 下 一 条 需 执 行 的 微 指 令 地 址 。 在 微 指令 序 
列 的 执行 过 程 中 ,大 部 分 情况 下 每 条 微 指令 的 后 续 微 指令 都 是 确定 的 ,这 样 , 只 要 在 编制 微 
程序 时 把 后 续 微 指令 存放 在 控 存 的 后 续 相 邻 单 元 中 ,就 可 以 按照 计数 器 指定 的 顺序 执行 ,每 
执行 完 一 条 微 指令 ,计数 器 pPC 就 顺序 增 量 一 次 ;对 于 少数 几 个 需要 根据 不 同 的 指令 操作 
码 或 操作 数 的 不 同 寻 址 方式 进行 选择 的 情况 ,可 以 用 一 个 调度 表 或 在 微 程序 中 插入 转移 微 
指令 (分 支 微 指令 ) 来 实现 。 

下 址 字段 法 的 基本 思想 : 在 每 条 微 指 令 中 ,增加 一 个 字段 ,用 于 指出 下 一 条 要 执行 的 微 
指令 的 地 址 ,在 遇 到 有 多 个 后 续 微 指令 (多 分 支 ) 的 情况 时 ,采用 一 个 调度 表 或 相应 的 地 址 修 
改 逻 辑 来 实现 多 分 支 。 

36. 中 断 (Interrupt) 和 异常 (Exception) 的 区 别 是 什么 ? 

答 : 有 关中 断 和 蜡 常 ,不 同 教科 书 或 体系 结构 有 不 同 的 含义 。 有 些 作 者 或 体系 结构 并 
不 区 分 它们 , 把 它们 统称 为 中 断 , 如 Intel 80x86 系统 用 中 断 指 代 所 有 的 意外 事件 。 而 
PowerPC 用 异常 来 指 代 意 外 事件 ,用 中 断 表示 指令 执行 时 控制 流 的 改变 。 在 MIPS 系统 和 
一 些 经 典 的 国外 教科 书 中 异常? 和“ 中断” 的 概念 是 有 区 别 的 。 根 据 事件 来 自 处 理 器 内 部 
还 是 外 部 来 区 分 ,把 执行 指令 过 程 中 由 指令 本 身 引 起 的 来 自 处 理 器 内 部 的 异常 事件 称 为 “ 异 
常 ”, 把 来 自 处 理 器 外 部 的 由 外 部 设备 通过 "中断 请 求 ” 信 号 向 CPU 申请 的 事件 称 为 
“中 断 ”。 

37. 除了 有 外 设 向 CPU 发 中 断 请 求 要 求 中 断 CPU 外 ,还 有 哪些 情况 会 中 断 CPU 正在 
运行 的 程序 , 转 到 其 他 相应 的 处 理 过 程 去 执行 ? 

答 : 以 下 4 种 情况 发 生 时 ,会 中 断 CPU 正在 运行 的 程序 , 转 到 其 他 相应 的 处 理 过 程 去 
执行 。 

(1) 在 程序 执行 过 程 中 , 若 外 设 完 成 任务 或 发 生 某 些 特 殊 事 件 ( 如 打印 机 缺 纸 . 定 时 采 
样 计数 时 间 到 、 键 盘 缓冲 满 等 ), 会 向 CPU 发 中 断 请 求 ,要 求 CPU 对 这 些 情况 进行 处 理 。 
处 理 完 后 , 回 到 原 被 中 断 程序 的 断 点 处 继续 执行 。 这 种 情况 称 为 IO 中 断 或 外 部 中 断 , 特 
指 由 CPU 外 部 的 设备 向 CPU 发 的 中 断 请 求 。 

《2) 在 执行 某 条 指令 时 ,可 能 发 生 一 些 特殊 的 “异常 事件 ”, 如 缺 页 、 溢 出 、 除 数 为 0、 非 法 
操作 码 等 ,使 当前 指令 无 法 继续 执行 。 此 时 也 要 求 CPU 中 止 原 程序 的 执行 , 转 到 处 理 相应 
情况 的 程序 去 执行 ,处 理 完 后 ,再 回 到 发 生 异 常 的 指令 继续 执行 。 这 种 情况 , 称 为 失效 或 故 
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摩 (Fault) ,是 由 正在 执行 的 指令 产生 的 。 

(3) 还 有 一 类 是 人 为 设 定 的 事件 ,在 程序 中 事先 设 定 一 条 特殊 的 指令 ,通过 执行 这 条 特 
殊 指令 ,自动 中 止 正在 执行 的 原 程序 , 转 到 一 个 特定 的 内 核 管理 程序 去 执行 ,执行 完 后 , 回 到 
那 条 特殊 指令 后 面 的 一 条 指令 开始 执行 。 称 为 自愿 中 断 或 自 陷 (Trap)。 这 些 特殊 指令 称 
为 “ 访 管 指令 ”( 访 问 管理 程序 ) 或 “ 自 陷 指 令 ”( 自 动 调 人 陶 阱 ), 如 80x86 中 的 指令 “INT n”。 

(4) 还 有 一 种 情况 , 既 不 是 外 部 设备 发 出 ,也 不 是 指令 本 身 产生 ,是 在 执行 指令 过 程 中 
发 生 了 硬件 故障 ,如 电源 掉 电 、 线 路 故障 等 ,使 CPU 无 法 继续 执行 。 这 类 异常 是 随机 发 生 
的 ,对 引起 异常 的 指令 的 确切 位 置 无 法 确定 ,出 现 这 类 严重 错误 时 , 原 程序 无 法 继续 执行 ,只 
好 终止 ,而 由 中 断 服务 程序 重新 启动 操作 系统 。 因 此 这 种 情况 被 称 为 终止 (Abort)。 

综 上 所 述 , 上 述 4 种 中 断 源 (异常 事件 ) 分 为 两 大 类 。 第 一 种 称 为 外 中 断 ( 有 时 简称 为 中 
断 Interrupt) ,后 面 3 种 称 为 内 中 断 ( 也 称 为 异常 ,程序 性 中 断 ,或 软 中 断 ), 分 别 为 故障 
(Fault)、 自 陷 CTrap) 和 终止 (Abort)。 内 中 断 是 在 执行 特定 的 指令 时 发 生 的 ,不 需要 通过 外 
部 中 断 请 求 线 进行 中 断 请 求 。 

38, 为 什么 在 设计 处 理 器 时 必须 考虑 异常 和 中 断 的 情况 ? 

答 : 异常 和 中 断 是 CPU 在 执行 指令 过 程 中 ,指令 自身 或 外 部 设备 发 生 的 一 些 特殊 事 
件 , 这 些 特殊 事件 使 得 当前 指令 不 能 继续 执行 下 去 ,或 者 ,需要 CPU 停 下 当前 程序 的 执行 ， 
去 处 理 外 部 中 断 事 件 。 因 此 ,在 数据 通路 中 必须 要 考虑 相应 的 检测 线路 ,能 够 发 现 这 种 特殊 
的 异常 事件 ,并 且 还 要 考虑 相应 的 控制 转换 电路 ,能 够 完成 “关中 断 ”“ 保 护 断 点 ”和 “将 处 理 
异常 事件 的 程序 的 入 口 地 址 加 载 到 PC 中 ”, 使 得 控制 转 到 异常 处 理 程序 。 通 常 把 这 种 控制 
转换 电路 的 执行 过 程 称 为 “中 断 隐 指 令 ” 的 执行 过 程 ,在 这 个 过 程 中 实现 了 对 “内 部 异常 ”和 
“外 部 中 断 ” 的 响应 。 


6.5 单项 选择 题 
1. 机 器 主 频 的 倒数 (一 个 节拍 ) 等 于 ( )。 
A. CPU 时 钟 周期 B. 主板 时 钟 周期 
C. 指令 周期 D. 存储 周期 


2. CPU 中 控制 器 的 功能 是 ( 这 
A. 产生 时 序 信号 
B. 控制 从 主 存 取 出 一 条 指令 
C. 完成 指令 操作 码 译 码 
D. 完成 指令 操作 码 译 码 , 并 产生 操作 控制 信号 
3. 汉 ， 诺 依 曼 计 算 机 中 指令 和 数据 均 以 二 进 制 形式 存放 在 存储 器 中 , CPU 依 
据 ( ”) 来 区 分 它们 。 


A. 指令 和 数据 的 表示 形式 不 同 B. 指令 和 数据 的 寻 址 方式 不 同 

C. 指令 和 数据 的 访问 时 点 不 同 D. 指令 和 数据 的 地 址 形式 不 同 
4 下 列 寄存 器 中 ,对 汇编 语言 程序 员 不 透明 的 是 (。 )。 

A. 存储 器 地 址 寄存 器 (MAR) B. 程序 计数 器 (PC) 


C. 存储 器 数据 寄存 器 (MDR) D. 指令 寄存 器 (IR) 
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9. 


10, 


12. 


13. 


14. 


下 列 有 关 控 制 器 各 部 件 功能 的 描述 中 ,错误 的 是 ( )。 

A. 控制 单元 是 其 核心 部 件 ,用 于 对 指令 操作 码 译 码 并 生成 控制 信号 
B. PC 称 为 程序 计数 器 ,用 于 存放 将 要 执行 的 指令 的 地 址 

C. 通过 将 PC 按 当前 指令 长 度 增 量 ,可 实现 指令 的 按 序 执行 

D. IR 称 为 指令 寄存 器 ,用 来 存放 当前 指令 的 操作 码 


.PC 中 存放 的 是 后 继 指 令 的 地 址 , 故 PC 的 位 数 和 (  ) 的 位 数 相同 。 


A， 指令 寄存 器 IR B. 指令 译 码 器 ID 
C. 主 存 地 址 寄存 器 MAR D. 程序 状态 字 寄 存 器 PSWR 


.通常 情况 下 ,下 列 ( 。””) 部 件 不 包含 在 中 央 处 理 器 (CPU) 芯 片 中 。 


A. ALU B. 控制 器 C. 寄存 器 D. DRAM 


. 下列 有 关 程 序 计数 器 PC 的 叙述 中 ,错误 的 是 ( )。 


A. 每 条 指令 执行 后 ,PC 的 值 都 会 被 改变 

B. 指令 顺序 执行 时 ,PC 的 值 总 是 自动 加 1 

C. 调用 指令 执行 后 ,PC 的 值 一 定 是 被 调用 过 程 的 入 口 地 址 
D. 无 条 件 转移 指令 执行 后 ,PC 的 值 一 定 是 转移 目标 地 址 
CPU 取出 一 条 指令 并 执行 该 指令 的 时 间 被 称 为 ( “)。 

A. 时 钟 周期 B. CPU 周期 C. 机 器 周期 D. 指令 周期 
下 列 有 关 指 令 周期 的 叙述 中 ,错误 的 是 ( )。 

A. 指令 周期 的 第 一 个 阶段 一 定 是 取 指 令 阶段 

B. 乘法 指令 和 加 法 指令 的 指令 周期 总 是 一 样 长 

C. 一 个 指令 周期 由 若干 个 机 器 周期 或 时 钟 周 期 组 成 

D. 单 周期 CPU 中 的 指令 周期 就 是 一 个 时 钟 周期 


.下列 有 关 CPU 时 钟 信 号 的 叙述 中 ,错误 的 是 ( “)。 


A. 处 理 器 总 是 每 来 一 个 时 钟 信号 就 开始 执行 一 条 新 的 指令 

B. 边沿 触发 指 状态 单元 总 在 时 钟 上 升 沿 或 下 降 沿 改变 状态 

C. 时 钟 周期 以 相 邻 状态 单元 之 间 最 长 组 合 逻 辑 延迟 为 基准 确定 
D. 每 个 时 钟 周期 称 为 一 个 节拍 ,机 器 的 主 频 就 是 时 钟 周期 的 倒数 
下 列 有 关 数 据 通 路 的 叙述 中 ,错误 的 是 ( )。 

A. 数据 通路 由 若干 操作 元 件 和 状态 元 件 连接 而 成 

B. 数据 通路 的 功能 由 控制 部 件 送 出 的 控制 信号 决定 

C. ALU 属于 操作 元 件 , 用 于 执行 各 类 算术 和 逮 辑 运算 

D. 通用 寄存 器 属于 状态 元 件 ,但 不 包含 在 数据 通路 中 

下 列 有 关 取 指令 操作 部 件 的 叙述 中 ,错误 的 是 (。  )。 

A. 取 指 令 操 作 的 延 时 主要 由 存储 器 的 取 数 时 间 决 定 

B. 取 指 令 操作 可 以 和 下 条 指令 地 址 的 计算 操作 同时 进行 

C. 单 周 期 数据 通路 中 需 用 一 个 指令 寄存 器 存放 取出 的 指令 

D. PC 在 单 周期 数据 通路 中 不 需要 “ 写 使 能 ”控制 信号 

下 列 有 关 多 周期 数据 通路 和 单 周期 数据 通路 比较 的 叙述 中 ,错误 的 是 ( )。 
A. 单 周期 处 理 器 的 CPI 总 比 多 周期 处 理 器 的 CPI 大 
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B. 单 周 期 处 理 器 的 时 钟 周期 比 多 周期 处 理 器 的 时 钟 周 期 长 
C. 在 一 条 指令 执行 过 程 中 , 单 周期 处 理 器 中 的 每 个 控制 信号 取 值 一 直 不 变 , 而 多 
周期 处 理 器 中 的 控制 信号 可 能 会 发 生 改 变 
D. 在 一 条 指令 执行 过 程 中 , 单 周期 数据 通路 中 的 每 个 部 件 只 能 被 使 用 一 次 ,而 在 
多 周期 中 同一 个 部 件 可 使 用 多 次 
15. 下 面 是 有 关 MIPS 架构 的 R- 型 指令 数据 道路 设计 的 叙述 : 
@ 在 R- 型 指令 数据 通路 中 ,一 定 会 有 一 个 具有 读 口 和 写 口 的 通用 寄存 器 组 
@ 在 R- 型 指令 数据 通路 中 ,一 定 有 一 个 ALU 用 于 对 寄存 器 读 出 数据 进行 运算 
@ 在 R- 型 指令 数据 通路 中 ,一 定 存在 一 条 路 径 使 ALU 输出 被 送 到 某 个 寄存 器 
@ 执行 R- 型 指令 时 ,通用 寄存 器 堆 的 “ 写 使 能 ”控制 信号 一 定 为 “1” 
以 上 儿 述 中 ,正确 的 有 (  )。 
A. DO B. DO@ C. ODO D. 全 部 
16. 下 面 是 有 关 MIPS 架构 的 lw/sw 指令 数据 通路 设计 的 叙述 : 
Q@ 在 lw/sw 指令 数据 通路 中 ,一 定 有 一 个 符号 扩展 部 件 用 于 偏 移 量 的 扩展 
@@ 在 lw/sw 指令 数据 通路 中 ,ALU 的 控制 信号 一 定 为 <add”( 即 ALU 做 加 法 ) 
@ 寄存 器 堆 的 “ 写 使 能 ”信号 在 lw 指令 执行 时 为 “1”, 在 sw 指令 执行 时 为 “0” 
@ 数据 存储 器 的 “ 写 使 能 ?信号 在 lw 指令 执行 时 为 “0”, 在 sw 指令 执行 时 为 “1” 
以 上 和 令 述 中 ,正确 的 有 (  )。 
A. .OO B. OO@.@ C. OO.@.@ D. 全 部 
17. 下 面 是 有 关 MIPS 架构 的 beq 指令 的 单 周 期 数据 通路 设计 的 叙述 : 
QO@ 在 beq 指令 的 执行 过 程 中 ,ALU 的 两 个 输入 都 来 自 寄存 器 堆 
@ 在 beq 指令 数据 通路 中 ,ALU 的 控制 信号 一 定 为 “sub”( 即 ALU 做 减法 ) 
@ 在 beq 指令 数据 通路 中 ,一 定 有 一 个 加 法 器 用 于 计算 目标 转移 地 址 
@ 在 beq 指令 的 执行 过 程 中 ,数据 不 会 流 经 符号 扩展 部 件 
以 上 叙 述 中 ,正确 的 有 (  )。 
A. ODD.Y B. DODO.@ C. OY D. 全 部 
18. 某 计算 机 指令 集中 包含 有 RR 型 运算 指令 、 取 数 指令 Load、 存 数 指令 Store、 分 支 指 
令 Branch 和 跳 转 指令 Jump。 若 采用 单 周 期 数据 通路 实现 该 指令 系统 ,各 主要 功能 部 件 的 
操作 时 间 为 : 指令 存储 器 和 数据 存储 器 都 是 3ns;ALU 和 加 法 器 都 是 2ns; 寄 存 器 堆 的 读 和 
写 都 是 1ns。 在 不 考虑 多 路 复 用 器 、 控 制 单 元 `. PC、 符号 扩展 单元 和 传输 线路 等 延迟 的 情况 
下 ,该 计算 机 时 钟 周期 至 少 为 (  )。 
A. 6ns B. 8ns C. 10ns D. 12ns 
19. 下 列 有 关 微 指令 格式 的 描述 中 ,错误 的 是 (  )。 
A. 相对 于 直接 控制 法 (不 译 法 ) ,字段 直 接 编码 法 的 控 存 利用 率 更 高 
B. 相对 于 字段 直接 编码 法 ,直接 控制 法 (不 译 法 ?的 执行 速度 更 快 
C. 相对 于 断定 法 (下 址 字段 法 ) ,采用 计数 器 法 的 微 指令 格式 更 短 
D. 相对 于 水 平 型 微 指令 ,一 条 垂直 型 微 指 令 中 包含 的 微 命令 更 多 
20. 下 列 有 关 指 令 和 微 指令 之 间 关 系 的 描述 中 ,正确 的 是 ( )。 
A. 一 条 指令 的 功能 通过 执行 一 条 微 指 令 来 实现 
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B. 一 条 指令 的 功能 通过 执行 一 个 微 程序 来 实现 

C. 一 条 微 指令 的 功能 通过 执行 一 条 指令 来 实现 

D. 一 条 微 指令 的 功能 通过 执行 一 个 微 程序 来 实现 
21. 相对 于 微 程序 控制 器 , 硬 布 线 控制 器 的 特点 是 (。 )。 


A. 指令 执行 速度 慢 


C. 指令 执行 速度 快 
D. 指令 执行 速度 快 


,指令 功能 的 修改 和 扩展 容易 
B. 指令 执行 速度 慢 ， 


指令 功能 的 修改 和 扩展 难 


,指令 功能 的 修改 和 扩展 容易 
,指令 功能 的 修改 和 扩展 难 


22， 以 下 给 出 的 事件 中 ,无须 异常 处 理 程序 进行 处 理 的 是 ( )。 


A. 缺 页 故障 
C. 地 址 越界 


B. 访问 cache 缺失 
D. 除数 为 0 


23.， 以 下 有 关 “ 自 陷 ”Trap) 异 常 的 叙述 中 ,错误 的 是 (  )。 
A.“ 自 陷 ? 是 人 为 预先 设 定 的 一 种 特定 处 理事 件 
B. 可 由 “ 访 管 指令 ”或 “ 自 陷 指 令 ” 的 执行 进入 “ 自 陷 ” 
C. 一 定 是 出 现 了 某 种 异常 情况 才 会 发 生 “ 自 陷 ” 
D.“ 自 陷 ” 发 生 后 CPU 将 进入 操作 系统 内 核 程序 执行 


【参考 答案 】 

1. A 2.D 
8.B 9.D 
15. D 16.D 
22. B 23.C 


3.C 4. B 5.D 6.C 2D 
10. B 11. A 12. D 13. C 14. A 
L722 18. C 19. D 20. B 21. D 


6.6 分 析 应 用 题 


1. 某 计算 机 主 频 为 800MHz, 其 CPU 采用 三 级 时 序 ( 机 器 周期 -节拍 -脉冲 ) 进 行 定 时 ， 
为 单 脉冲 节拍 方式 ,每 个 机 器 周期 的 基本 宽度 为 4 个 节拍 。 该 机 每 个 指令 周期 平均 有 5 个 
机 器 周期 ,并 平均 访问 2 次 主 存 ,采用 非 缓存 (无 cache) 访 问 。 请 回答 下 列 问题 : 

(1) 若 采用 异步 方式 访问 内 存 , 每 个 "存储 器 读 ? 机 器 周期 平均 需 8 个 节拍 ,每 个 “存储 


器 写 ? 机 器 周期 平均 需 6 个 节拍 , 则 执行 一 条 指令 的 平均 时 间 为 多 少 ? MIPS 数 为 多 少 ? 平 


均 CPI 为 多 少 ? 


〈2) 若 采用 同步 方式 访问 内 存 , 每 个 “存储 器 读 ? 机 器 周期 需 插 入 4 上 个“ 等待 状态 ,每 个 
“存储 器 写 ? 机 器 周期 无 须 “ 等 待 ? 状 态 , 则 执行 一 条 指令 的 平均 时 间 为 多 少 ? MIPS 数 为 多 
少 ? 平均 CPI 为 多 少 ? (提示 : 一 个 “等 待 状态 ” 即 一 个 节拍 


【分 析 解 答 】 


早期 的 计算 机 中 没有 cache,CPU 访 存 时 ,由 于 主 存 速度 慢 ,无 法 像 访问 寄存 器 和 cache 
那样 能 在 一 个 节拍 内 存 取 好 数据 ,因此 ,需要 CPU 等 待 若干 个 节拍 才能 完成 存储 访问 。 因 
而 “存储 器 读 ” 和 “存储 器 写 ” 机 器 周期 比 基 本 的 无 访 存 操作 机 器 周期 长 。 


(1) CPU 和 主 存 之 间 采 上 


异步 方式 通信 时 ,CPU 每 次 发 送 读 或 写 命令 后 , 便 在 随后 的 


每 个 节拍 内 采样 主 存 送 来 的 “存储 操作 完成 ”CMFC) 信 号 ,以 便 在 主 存 数据 准备 好 时 ,到 存 


史 光 处理 器 
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储 器 数据 寄存 器 (MDR) 中 取 数 据 或 将 MDR 中 数据 写 到 主 存 。 由 题 意 可 知 ,在 异步 方式 
下 ,每 条 指令 的 平均 时 钟 周期 (节拍 ) 数 为 (5 一 2) X4 十 2X((8 十 6)/2) 一 26 ,所 以 CPI 一 26。 
执行 一 条 指令 的 平均 时 间 为 26X1/(800X10*Hz) 一 32.5ns。MIPS 数 约 为 800/26 一 31。 

(2) CPU 和 主 存 之 间 采 用 同步 方式 通信 时 ,CPU 每 次 发 送 读 或 写 命令 后 , 便 按照 同步 
通信 协议 ,在 等 待 一 个 固定 长 度 的 时 间 ( 若 干 个 节拍 ) 后 ,到 存储 器 数据 寄存 器 (MDR) 中 取 
数据 或 将 MDR 中 数据 写 到 主 存 。 由 题 意 可 知 ,在 同步 方式 下 ,每 条 指令 的 平均 时 钟 周期 
(节拍 ) 数 为 (5 一 2) X4 十 2X((4 十 4 十 4)/2) = 二 24, 所 以 CPI=24。 执 行 一 条 指令 的 平均 时 间 
为 24X1/(800X105Hz) 一 30ns。MIPS 数 约 为 800/24==33。 

2. 某 计算 机 的 字 长 为 16 位 ,采用 16 位 定 长 指令 字 格 式 ,其 部 分 数据 通路 的 结构 如 
图 6.8 所 示 。 假 设 MAR 的 输出 一 直 处 于 使 能 状态 。 加 法 指令 “add (R1),R0” 的 功能 为 
M[R[R1]]<-M[R[R1]] 十 RIRO] 。 


存储 器 (M) 
MemR MemW Data Addr 
{ { { CB 
< > 
DB 
< > 
AB 
t 1 
MAR -MARin MDRin 一 ” MDR 
Y-MDRout 
| | 1 内 总 线 
ROout Ain—~| A f 全 PCout 
ROin -| RO PC pCin 
Rlout 
Rlin -一 | RI pe 全 
控制 信号 图 例 IR IRin 
人 Xout 三 态 门 及 其 控制 信号 
一 Xin 寄存 器 输入 控制 信号 


至 指令 译 码 部 件 


图 6.8 题 2 的 数据 通路 


表 6.2 给 出 了 上 述 指 令 取 指 和 译 码 阶段 每 个 节拍 (时 钟 周 期 ) 的 功能 和 有 效 控制 信号 ,请 
按 表 中 描述 方式 列 出 指令 执行 阶段 每 个 节拍 的 功能 和 有 效 控制 信号 ,并 说 明 需 要 多 少 节拍 。 
表 6.2 题 2 取 指令 阶段 的 控制 信号 


时 钟 功 能 有 效 控制 信号 
Cl MAR<—(PC) PCout, MARin 
> MDR<—M(MAR) MemR 
PC<—(PC)+1 PC+1 
C3 IR—(MDR) MDRout, IRin 
C4 指令 译 码 无 
【分 析 解 答 】 


加 法 指令 “add(R1),R0” 的 执行 阶段 每 个 节拍 的 功能 和 控制 信号 如 表 6. 3 所 示 。 
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表 6.3 题 2 指令 执行 阶段 的 控制 信号 


时 钟 功 能 有 效 控制 信号 
Cs MAR< (CR1) Rlout,MARin 
c6 MDR<-M(MAR) MemR 

A<—(RO) ROout, Ain 
C7 AC<-A+ (MDR) MDRout, Add 
C8 MDR<—(AC) ACout, MDRin 
C9 MCMAR) 一 MDR MemW 


从 表 6. 3 可 以 看 出 ,在 C6 节拍 中 同时 进行 了 存储 器 读 和 寄存 器 间 传 送 , 这 样 , 该 指令 
的 执行 阶段 共有 5 个 节拍 。 当 然 ,也 可 将 存储 器 读 和 寄存 器 间 传 送 操作 安排 在 不 同 的 节拍 
内 进行 ,这 样 得 到 表 6.4。 此 时 ,执行 阶段 共有 6 个 节拍 。 


表 6.4 题 2 指令 执行 阶段 的 控制 信号 


时 钟 功 能 有 效 控制 信号 
C5 MAR<-(R1) Rlout, MARin 
C6 MDR<-M(MAR) MemR 

C7 A—(MDR) MDRout, Ain 
C8 AC<A+ (RO) Roout, Add 

C9 MDR<—(AC) ACout, MDRin 
C10 M(MAR)<-MDR MemW 


3. 假定 在 如 图 6. 9 所 示 的 单 总 线 数据 通路 中 ,总 线 传输 延迟 和 ALU 运算 时 间 分 别 是 
20ps 和 200ps, 寄 存 器 建立 时 间 为 10ps, 寄 存 器 保持 时 间 为 5ps, 寄 存 器 的 锁 存 延迟 (Clk-to-Q)》 
为 4ps, 控 制 信号 的 生成 延迟 (Clk-to-signal) 为 7ps, 三 态 门 接 通 时 间 为 3ps, 则 从 当前 时 钟 到 
达 开 始 算 起 ,完成 以 下 操作 的 最 短 时 间 是 多 少 ? 各 需要 几 个 时 钟 周期 ? 

(1) 将 数据 从 一 个 寄存 器 传送 到 另 一 个 寄存 器 。 

《2) 将 程序 计数 器 PC 加 1。 


个 
指令 译 码 器 | 一 j 一 | RO 
IR 六 一 一 一 Ro-D 
PC | 一 一] 
一 Y 
地 址 线 一 一 | MR hm 一 
aas| Se 加 A 
数据 线 一 -| MDR (a 减 ] 控 
1 一 Cu 
一 下 Z 
So 


图 6.9 单 总 线 数据 通路 
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【分 析 解 答 】 

图 6. 9 所 示 的 数据 通路 中 ,所 有 与 内 部 总 线 相连 的 寄存 器 都 有 相应 的 Re 和 /或 Re. 控 
制 信号 ,以 控制 总 线 和 寄存 器 之 间 的 数据 传送 。 总 线 和 ALU 输入 端 之 间 、Y 寄存 器 与 
ALU 输入 端 之 间 都 无 须 控制 信号 。ALU 输出 与 Z 寄存 器 之 间 可 以 有 控制 信号 Zu, 也 可 以 
没有 。 若 没有 Za, 则 每 来 一 个 时 钟 ,ALU 的 输出 总 是 被 写 人 Z 寄存 器 。 以 下 说 明 中 ,为 了 
明显 表示 ALU 输出 送 Z 寄存 器 ,假定 有 控制 信号 Zi。 

图 6. 10 给 出 了 单 总 线 数据 通路 中 主要 路 径 的 定时 。 时 钟 边 沿 到 达 后 ,经 过 Clk-to-Q 
的 延 时 ,寄存 器 中 的 内 容 被 读 出 ,同时 ,在 指令 译 码 器 中 的 控制 逻辑 生成 当前 时 钟 周 期 内 所 
需要 的 控制 信号 ,其 延 时 为 Clk-to-signal。 随 后 ,由 生成 的 控制 信号 Rio 接 通 三 态 门 , 并 使 
寄存 器 数据 在 总 线 上 传输 。 若 当前 时 钟 周期 内 不 做 ALU 运算 而 是 直接 在 寄存 器 之 间 传 
送 , 则 总 线 上 的 数据 在 Rij, 的 控制 下 直接 被 送 到 目的 寄存 器 Rj 的 输入 端 ,在 下 一 个 时 钟 边 
沿 到 来 之 前 ,总 线 上 的 数据 必须 继续 稳定 一 段 寄 存 器 建立 时 间 , 以 使 寄存 器 Rj 的 输入 在 这 
段 建立 时 间 内 保持 不 变 , 如 图 6. 10Ca) 所 示 ; 若 当前 时 钟 周期 内 有 ALU 运算 , 则 还 需 ALU 
电路 延 时 ,最 后 ALU 结果 直接 送 Z 寄存 器 ,在 下 一 个 时 钟 边沿 到 来 之 前 ,ALU 的 输出 必须 
继续 稳定 一 段 寄 存 器 建立 时 间 , 以 使 寄存 器 Z 的 输入 在 这 段 建立 时 间 内 保持 不 变 , 如 
图 6. 10(b) 所 示 。 


Clk-to-Q 


1 

中 总 线 伟 建立 1 保持 

Clk-to_Sig ea- -ul 输 时 间 -时间 ~ 
1 


We 上 


1 1 
to t tb 6 6 


(a) 当前 周期 内 不 执行 ALU 运 算 


局 | Clk-to-Q 
~! |, 寄存 器 输出 开始 有 效 ! 
”” 接 通 三 态 ”总 线 传 建立 | 保持 
Chto-Signal 门 时 间 ，， 输 时 间 ._) ALU 时 延 | 时间 .| 时 间 | 
1 


| 
H 1 1 
| 1 | | 
Ri 1 1 1 ] 
| | | 1 1 
1 1 1 1 
1 1 1 1 
Zr | ! ! ! 1 
to t b 6 ta ts 


(b) 当前 周期 内 执行 ALU 运 算 
图 6.10 单 总 线 数据 通路 中 主要 路 径 的 定时 


(1) 由 图 6.10(a) 可 知 ,寄存 器 之 间 进 行 传送 的 时 间 延 迟 至 少 为 7 十 3 十 20 十 10 二 40ps。 
在 寄存 器 数据 传送 过 程 中 ,只 需要 在 一 个 寄存 器 中 保存 信息 ,因此 只 需要 一 个 时 钟 周期 就 可 
完成 该 操作 。 
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《2) 将 PC 中 的 内 容 加 1 送 PC, 被 分 解 成 以 下 两 个 过 程 : PC 加 1 送 Z、Z 送 PC。 对 于 
第 一 个 过 程 ,由 图 6. 10(b) 可 知 , 其 延迟 至 少 为 7 十 3 十 20 十 200 十 10 王 240ps; 第 二 个 过 程 实 
现 的 是 寄存 器 之 间 的 传送 ,因此 延迟 至 少 为 40ps。 因 为 在 该 操作 过 程 中 分 别 在 寄存 器 Z 和 
PC 中 保存 了 共 两 次 信息 ,所 以 需要 两 个 时 钟 周期 才能 完成 该 操作 。 

4. 假定 某 计算 机 字 长 16 位 ,CPU 内 部 结构 如 图 6. 9 所 示 ,CPU 和 存储 器 之 间 采 用 同 
步 方 式 通信 , 按 字 编 址 。 采 用 定 长 指令 字 格 式 ,指令 由 两 个 字 组 成 ,第 一 字 指 明 操作 码 、 寻 址 
方式 和 一 个 寄存 器 编号 ,第 二 字 为 立即 数 imm16。 若 一 次 存储 访问 所 用 时 间 为 2 个 CPU 
时 钟 周期 Readl 和 Read2 ,每 次 存储 访问 存 取 一 个 字 , 取 指令 阶段 第 二 次 访 存 已 将 imm16 
取 到 MDR 中 ,请 写 出 下 列 指令 在 执行 阶段 的 控制 信号 序列 ,并 说 明 需 要 几 个 时 钟 周 期 。 

(1) 将 imm16 加 到 寄存 器 R1 中 , 即 RULR1]<RLR1] 十 imml6 。 

(2) 将 存储 单元 imm16 中 的 内 容 加 到 寄存 器 R1 中 ,此 时 ,imml6 为 直接 地 址 。 即 
RLR1]<-RLR1] 十 MLimml16] 。 

(3) 将 存储 单元 imm16 中 的 内 容 作 为 地 址 访问 主 存 , 将 读 出 的 内 容 再 作为 地 址 访问 主 
存 , 然 后 将 读 出 的 内 容 加 到 寄存 器 Rl 中。 此 时 ,imm16 为 间接 地 址 。 即 RLR1]<-RLR1] 十 
MLM[Limml16]] 。 

【分 析 解 答 】 

图 6. 9 所 示 的 数据 通路 中 ,所 有 与 内 部 总 线 相连 的 寄存 器 都 有 相应 的 Re 和 /或 Re 控 
制 信号 ,以 控制 总 线 和 寄存 器 之 间 的 数据 传送 。 总 线 和 ALU 输入 端 之 间 、Y 寄存 器 与 
ALU 输入 端 之 间 都 无 须 控制 信号 。ALU 输出 与 Z 寄存 器 之 间 可 以 有 控制 信号 Zu, 也 可 以 
没有 ,此 时 ,每 来 一 个 时 钟 ,ALU 的 输出 总 是 被 写 人 Z 寄存 器 。 以 下 说 明 中 ,为 了 明显 表示 
ALU 输出 送 2Z 寄存 器 ,假定 有 控制 信号 Zi 。 

(1) 指令 功能 为 RER1]< 一 R[R1] 十 imm16 时 ,执行 阶段 不 需要 访 存 操作 ,因此 ,可 用 
3 个 时 钟 周期 完成 ,分 别 包含 以 下 各 控制 信号 。 


MDRowt , Yir 
R1lot ，add，2Zin 
Zouts Rlic 


(2) 指令 功能 为 RLR1]<RLR1] 十 MLimm16] 时 ,执行 阶段 需要 一 次 访 存 操作 ,因此 ， 
至 少 需要 以 下 5 个 时 钟 周 期 。 其 中 R16 Ya 这 两 个 控制 信号 可 以 在 Readl 周期 就 送出 ,并 
在 Read2 周期 中 保持 不 变 ,也 可 以 到 Read2 周期 时 再 送出 。 


MDRout ，MRRin 
Readl, (Rlowt, Yir) 
Read2, Rlow, Yir 
MDRout 1 add, Zin 
Zoues Rlin 


(3) 指令 功能 为 RLR1]<-R[LR1] 十 MLM[imm16]] 时 ,执行 阶段 需要 两 次 访 存 操作 , 因 
此 ,至 少 需 要 以 下 8 个 时 钟 周期 。 对 R1。..、Y;, 这 两 个 控制 信号 的 处 理 同 (2) 中 一 样 。 


MDRowt r MRRin 
Readl 


Read2 

MDRowt ，MRRin 
Readl1, (Rlout, Yir) 
Read2，R1。t ，Yin 
MDRowt ,1 add, Zir 


a RE 

5. 图 6.11 给 出 了 某 CPU 内 部 结构 的 一 部 分 ,MAR 和 MDR 直接 连 到 存储 器 总 线 ( 图 
中 省 略 ) 。 在 两 个 总 线 A 和 B 之 间 的 所 有 数据 传送 都 总 线 人 A 总 线 B 
和 需 经 过 算术 逻辑 部 件 ALU。ALU 的 部 分 功能 及 其 控 介 从 
制 信号 如 下 。 Lb 

MOVa: F=A;} MOVb: F=B; "| MOR 

Erle Perls Btls EaB+rl | A 


a-1: F=A-1;  b-1: F= B-1 

其 中 A 和 B 是 ALU 的 输入 ,F 是 ALU 的 输出 。 
假定 调用 指令 Call 占 两 个 字 , 第 一 个 字 是 操作 码 , 第 二 nt EE A 
个 字 给 出 子 程序 的 起 始 地 址 ,返回 地 址 保存 在 主 存 的 栈 本 
中 ,用 SP( 栈 指示 器 ) 指 向 栈 顶 , 主 存 按 字 编 址 ,每 次 以 | 
同步 方式 从 主 存 读 取 一 个 字 。 请 写 出 读 取 并 执行 Call | 
指令 所 要 求 的 控制 信号 序列 (提示 : 当前 指令 地 址 在 oF 
PC 中 ) ,并 说 明 至 少 需要 多 少 个 时 钟 周期 。 

【分 析 解答 】 图 6.11 题 5 的 图 示 

因为 采用 同步 方式 读 写 内 存 , 所 以 在 Read 和 
Write 信号 后 不 需 加 等 待 信号 WMFC。Call 指令 占 两 个 字 , 主 存 按 字 编 址 ,每 次 从 主 存 读 取 
一 个 字 , 因 此 ,Call 指令 需要 读 两 次 主 存 每 次 PC 加 1。 其 指令 周期 分 为 以 下 3 个 阶段 。 

(1) 读 取 指令 操作 码 : 将 PC 的 内 容 作 为 地 址 访问 存储 器 ,取出 指令 的 操作 码 , 送 指令 
寄存 器 IR, 同 时 PC 十 1 送 PC, 以 指向 指令 的 第 二 个 字 。 至 少 需 要 3 个 时 钟 周期 (节拍 ) 。 


PCout , MOVD, MARir 
Read, b+1, PCin 
MDRout ,1 MOVD, IRis 


(2) 读 取 子 程序 首 地 址 : 将 PC 的 内 容 作为 地 址 ,取出 指令 的 第 二 个 字 ( 即 子 程序 人 口 


地 址 ) 送 PC, 以 使 下 一 个 指令 周期 从 子 程序 的 第 一 条 指令 开始 执行 。 同 时 ,计算 PC 十 1 以 
得 到 返回 地 址 ,并 将 返回 地 址 送 耻 寄存器。 至少 需要 3 个 时 钟 周 期 。 


PCout, MOVD, MARir 

Read, b+1, Yic 

MDRout ,1 MOVD, PCin 

(3) 保存 返回 地 址 至 栈 中 : 将 临时 保存 在 了 寄存 器 的 返回 地 址 送 到 栈 顶 保存 ,并 将 SP 
的 内 容 减 1, 以 自动 调整 栈 顶 指针 。 至 少 需要 3 个 时 钟 周 期 。 


SPout, MOVD, MARir 
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Yout 1 MOVb，MDRin 
Write, SPow, b-1, SPin 


显然 ,上 述 每 个 节拍 中 执行 的 操作 所 需要 的 时 间 不 等 ,其 中 ,存储 访问 (Read/Write) 时 
间 最 长 ,时 钟 周期 以 最 长 的 存储 访问 时 间 为 准 ,Call 指令 的 指令 周期 至 少 有 9 个 时 钟 周期 
(节拍 )。 

如 果 将 第 一 次 PC 十 1 的 结果 送 到 了 寄存 器 ,第 二 阶段 以 Y 的 内 容 作为 地 址 访问 主 存 ， 
并 继续 对 了 寄存 器 加 1 ,结果 送 PC, 则 也 能 实现 Call 指令 的 功能 。 这 种 方式 下 ,也 是 9 个 时 
钟 周期 。 

6. 某 计算 机 字 长 16 位 ,标志 寄存 器 Flag 中 的 ZF、SF 和 OF 分 别 是 零 标志 、 符 号 标志 
和 溢出 标志 ,采用 双 字 节 定 长 指令 字 。 假 定 bgt (大 于 零 转 移 ) 指令 的 第 一 个 字 节 指明 操作 
码 OP 和 寻 址 方式 MOD, 第 二 个 字 节 为 偏 移 地 址 imm8, 用 补 码 表示 。 指 令 功能 是 : 

车 (ZF 十 (SF 四 OF)=0) 则 PC 二 PC 十 2 十 imm8X2, 否 则 PC 二 PC 十 2 
请 回答 下 列 问题 或 完成 相应 任务 。 

(1) 该 计算 机 的 编 址 单位 是 多 少 ? 

(2) bgt 指令 执行 的 是 带 符号 整数 比较 还 是 无 符号 数 比 较 ? 偏 移 地 址 imm8 的 含义 是 
什么 ? 转移 目标 地 址 的 范围 是 什么 ? 

(3) 画 出 实现 bgt 指令 的 数据 道路 。 

【分 析 和 解答 】 

(1) 因为 PC 的 增 量 是 2, 且 每 条 指令 占 2 个 字 节 ,所 以 编 址 单位 是 字 节 。 

(2) 根据 “大 于 ”条 件 判断 表达 式 , 可 以 看 出 该 bgt 指令 实现 的 是 带 符号 整数 比较 。 因 
为 无 符号 数 比 较 时 ,其 判断 表达 式 中 没有 溢出 标志 OF 。 偏 移 地 址 imm8 为 补 码 表示 ,说 明 
转移 目标 指令 可 能 在 bgt 指令 之 前 ,也 可 能 在 bgt 指令 之 后 。 计 算 转 移 目 标 地 址 时 , 偏 移 量 
为 imm8X2, 说 明 imm8 不 是 相对 地 址 ,而 是 相对 指令 条 数 。imm8 的 范围 为 一 128 一 127, 故 
转移 目标 地 址 的 范围 是 PC 十 2 十 (一 128X2)~PC 十 2 十 127X2, 即 转移 目标 地 址 的 范围 是 
相对 于 bgt 指令 的 前 254 个 单元 到 后 256 个 单元 之 间 ,用 指令 条 数 来 衡量 的 话 , 就 是 相对 于 
bgt 指令 的 前 127 条 指令 到 后 128 条 指令 之 间 。 

(3) 实现 bgt 指令 的 数据 通路 如 图 6. 12 所 示 。 
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图 6.12 实现 bgt 指令 的 数据 通路 
7. 如 果 图 6. 4 给 出 的 单 周期 数据 通路 对 应 的 控制 逻辑 发 生 错 误 ,使 得 控制 信号 
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RegWr、RegDst、Branch、MemWr、ExtOp 中 某 一 个 在 任何 情况 下 总 是 为 0, 则 这 些 控制 信和 号 
分 别 为 0 时 哪些 指令 不 能 正确 执行 ? 要 求 分 别 讨论 。 

【分 析 解 答 】 

若 RegWr 二 0, 则 所 有 需 写 结果 到 寄存 器 的 指令 (如 : R- 型 指令 .Load 类 指令 等 ) 都 不 能 
正确 执行 ,因为 寄存 器 不 发 生 写 操作 。 

若 RegDst 二 0, 则 所 有 R- 型 指令 都 不 能 正确 执行 ,因为 目的 寄存 器 指定 为 Rt 而 不 
是 Rd。 

若 Branch 一 0, 则 Branch 类 指令 可 能 出 错 ,因为 永远 不 会 发 生 转移 。 

车 MemWr 二 0, 则 Store 类 指令 不 能 正确 执行 ,因为 存储 器 不 能 写 人 所 需 数据 。 

车 ExtOp==0, 则 需要 符号 扩展 的 指令 (如 beq、lw/sw 等 ) 发 生 错 误 , 因 为 进行 的 是 0 
扩展 。 

8. 如 果 图 6. 4 给 出 的 单 周期 数据 通路 对 应 的 控制 逻辑 发 生 错误 ,使 得 控制 信号 
RegWr、RegDst、Branch、MemWr、ExtOp 中 某 一 个 在 任何 情况 下 总 是 为 1, 则 这 些 控制 信号 
分 别 为 1 时 哪些 指令 不 能 正确 执行 ? 要 求 分 别 讨论 。 

【分 析 解 答 】 

车 RegWr=1, 则 所 有 不 需 写 结果 到 寄存 器 的 指令 (如 sw、beq 等 ) 都 不 能 正确 执行 , 因 
为 错误 地 将 某 个 值 写 人 了 某 个 寄存 器 。 

若 RegDst 二 1, 则 lw 等 部 分 [型 指令 不 能 正确 执行 ,因为 目的 寄存 器 指定 为 Rd 而 不 
是 Rt。 

若 Branch=1, 则 非 Branch 类 指令 可 能 出 错 ,因为 可 能 会 发 生 不 必要 的 转移 。 

车 MemWr 二 1, 则 除 Store 类 指令 外 其 他 指令 都 不 能 正确 执行 ,因为 会 写 人 数据 到 存 
储 器 。 

若 ExtOp 王 1, 则 需要 0 扩展 的 指令 (如 ori 等 ) 可 能 会 发 生 错 误 , 因为 进行 的 是 符号 
扩展 。 

9. 如 果 图 6. 6 给 出 的 多 周期 数据 通路 对 应 的 控制 逻辑 发 生 错 误 , 使 得 控制 信号 
PCWr、IRWr、RegWr、BrWr、PCSource\MemWr、MemtoReg、PCWrCond、R-type 中 某 一 个 
在 任何 情况 下 总 是 为 0, 则 这 些 控制 信号 分 别 为 0 时 哪些 指令 不 能 正确 执行 ? 要 求 分 别 
讨论 。 

【分 析 解 答 】 

若 PCWr=0, 则 所 有 指令 都 不 能 正确 执行 ,因为 无 法 正确 地 更 新 PC。 

若 IRWr=0, 则 所 有 指令 都 不 能 正确 执行 ,因为 IR 中 不 能 写 人 当前 指令 ,也 就 无 法 进 
行 正确 的 指令 译 码 ,因此 后 续 的 指令 执行 过 程 都 不 正确 。 

若 RegWr 一 0, 则 所 有 需要 写 结果 到 寄存 器 的 指令 (如 R- 型 指令 、lw 等 部 分 工 型 指令 ) 
都 不 能 正确 执行 ,因为 寄存 器 不 发 生 写 操作 。 

若 PCSource 一 00, 则 除 j 指令 之 外 的 其 他 指令 都 不 能 正确 得 到 下 条 指令 地 址 。 

若 MemWr 王 0, 则 所 有 Store 类 指令 执行 错误 ,因为 数据 不 能 写 人 存储 器 中 。 

若 MemtoReg 一 0, 则 所 有 Load 类 指令 执行 错误 ,因为 写 人 寄存 器 的 是 ALU 输出 而 不 
是 读 出 的 存储 单元 的 内 容 。 

车 PCWrCond 一 0, 则 Branch 类 指令 执行 可 能 出 错 ,因为 永远 不 会 发 生 转移 。 
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车 R-type 二 0, 则 所 有 R- 型 指令 的 执行 可 能 出 错 ,因为 控制 信号 ALUetr 的 取 值 不 是 来 
自 对 R- 型 指令 进行 解释 的 ALU 局 部 控制 器 。 

10. 如 果 图 6.6 给 出 的 多 周期 数据 通路 对 应 的 控制 逻辑 发 生 错误 ,使 得 控制 信号 PCWr、 
IRWr、RegWr、BrWr、PCSource、MemWr、MemtoReg、PCWrCond、R-type 中 某 一 个 在 任何 情况 
下 总 是 为 1, 则 这 些 控制 信号 分 别 为 1 时 哪些 指令 不 能 正确 执行 ? 要 求 分 别 讨论 。 

【分 析 解 答 】 

若 PCWr=1, 则 程序 执行 顺序 失控 ,因为 每 个 时 钟 都 会 更 新 PC。 

若 IRWr=1, 则 所 有 指令 都 可 能 出 错 , 因 为 每 个 时 钟 周期 都 会 写 人 IR, 因 此 写 人 的 不 是 
当前 指令 。 

车 RegWr=1, 则 所 有 不 需 写 结果 到 寄存 器 的 指令 (如 sw、beq 等 ) 都 不 能 正确 执行 , 因 
为 错误 地 将 某 个 值 写 人 了 某 个 寄存 器 。 

车 PCSource 一 01, 则 j 指令 和 Branch 类 指令 不 能 正确 得 到 下 条 指令 地 址 。 

若 MemWr=1, 则 除 Store 类 指令 外 的 所 有 指令 执行 错误 ,因为 在 存储 器 写 人 了 不 该 写 
的 信息 。 

若 MemtoReg 一 1, 则 除 Load 类 指令 外 的 所 有 指令 执行 错误 ,因为 选择 了 错误 的 信息 写 
人 寄存 器 。 

车 PCWrCond 二 1, 则 除 Branch 类 指令 外 的 所 有 指令 可 能 出 错 ,因为 可 能 会 发 生 不 必要 
的 转移 。 

若 R-type 一 1, 则 所 有 非 R- 型 指令 的 执行 可 能 出 错 ,因为 控制 信号 ALUctr 的 取 值 来 自 
对 R- 型 指令 进行 解释 的 ALU 局 部 控制 器 。 

11. swap 指令 的 功能 是 实现 两 个 寄存 器 内 容 的 互 换 。 在 MIPS 指令 集中 增加 一 条 
swap 指令 有 两 种 方式 ,一 种 是 采用 伪 指 令 (软件 ?方式 ,这 种 情况 下 , 当 执行 到 swap 指令 
时 ,用 若干 条 已 有 指令 构成 的 指令 序列 来 代替 实现 ; 另 一 种 做 法 是 改动 硬件 以 实现 swap 指 
令 , 这 种 情况 下 , 当 执 行 到 swap 指令 时 , 则 直接 在 swap 指令 对 应 的 数据 通路 (硬件 ) 上 
执行 。 

(1) 写 出 MIPS 中 用 伪 指 令 方 式 实 现 “swap rs，rt? 时 的 指令 序列 。 

《2) 假定 用 硬件 的 实现 swap 指令 时 会 使 每 条 指令 的 执行 时 间 增 加 10% , 则 swap 指令 
在 程序 中 占 多 大 的 比例 才 值 得 用 硬件 方式 来 实现 ? 

(3) 采用 硬件 方式 实现 时 ,在 不 对 寄存 器 堆 进行 修改 的 情况 下 ,能 否 在 单 周 期 数据 通路 
中 实现 swap 指令 ? 对 于 多 周期 数据 通路 的 情况 又 怎样 ? 

【分 析 解 答 】 

(1) 车 在 伪 指 令 “swap rs, rt” 的 指令 序列 中 使 用 除 rs 和 rt 以 外 的 额外 寄存 器 , 则 额外 
寄存 器 的 内 容 会 被 指令 序列 破坏 ,因此 , 伪 指 令 的 指令 序列 中 一 般 不 能 用 额外 寄存 器 。 伪 指 
令 “swap rs，rt” 的 指令 序列 包含 以 下 3 条 指令 ,没有 用 到 额外 寄存 器 。 


Xor rs, rsr rt 
xor rt, rs, rt 


xor rs, rs, rt 


(2) 假定 “swap rs, rt” 指 令 所 占 比例 为 x(0 志 x<<1) ,其 他 指令 比例 为 1 一 x, 则 用 硬件 


小 关 相 更 曙 


实现 该 指令 时 , 程序 执行 时 间 为 原来 的 1.1X(z 十 1 一 zx) 三 1.1 倍 。 用 软件 实现 该 指令 时 ， 
程序 执行 时 间 为 原来 的 3z 十 1 一 z 一 2z 十 1 倍 。 因 此 , 当 1.1<2z 十 1 时 ,硬件 的 实现 才 有 意 
义 , 由 此 可 知 ,z>>0.05, 即 当 “swap rs,，rt” 指 令 在 程序 中 的 比例 大 于 5% 时 , 才 值 得 用 硬件 
方式 来 实现 该 指令 。 

(3) 在 单 周 期 数据 通路 中 ,所 有 指令 的 执行 都 在 一 个 时 钟 周期 内 完成 ,数据 总 是 在 时 钟 
边沿 被 写 人 寄存 器 堆 , 即 本 条 指令 执行 的 结果 总 是 在 下 条 指令 开始 ( 即 下 个 时 钟 到 来 ) 时 , 才 
开始 被 写 到 寄存 器 堆 中 ,因此 一 个 时 钟 周期 只 能 写 一 次 寄存 器 。 而 swap 指令 执行 过 程 中 
需要 多 次 写 寄存 器 ,因此 ,在 不 对 寄存 器 堆 进 行 修 改 的 情况 下 ,无 法 在 单 周 期 数据 通路 中 实 
现 swap 指令 ;对 于 多 周期 数据 通路 ,一 个 指令 周期 可 以 有 多 个 时 钟 周期 ,因而 可 以 多 次 写 
寄存 器 ,因此 ,在 不 对 寄存 器 堆 进行 修改 的 情况 下 ,swap 指令 可 以 在 多 周期 数据 通路 中 
实现 。 

12. 已 知 MIPS 中 有 一 条 转移 指令 jr(Jump Register) ,其 指令 格式 如 下 : 


31 2625 2120 1615 1110 家 这 0 
000000 rs 0 0 0 001000 


其 功能 是 读 出 rs 寄存 器 的 内 容 送 PC。 若 使 图 6.4 所 示 的 单 周 期 数据 通路 也 能 执行 jr 
指令 , 则 如 何 修改 单 周期 数据 通路 ? 需要 增加 什么 控制 信和 号? 

【分 析 解 答 】 

jr 指令 采用 R- 型 指令 格式 ,其 中 的 rt 和 rd 字段 都 是 0, 即 rt=rd== $0。 因 为 MIPS 处 
理 器 中 寄存 器 $ 0 的 内 容 永远 是 全 0, 它 可 被 读 出 ,但 不 能 改变 其 值 , 所 以 , 写 人 信和 号 对 寄存 
器 $0 不 起 作用 ,因而 ,可 以 把 jr 指令 看 成 是 结果 送 PC 的 加 法 指令 ,其 功能 为 RLrd] 一 
R[rsj] 十 R[rt],PC<-R[rs] 十 RLrt]。 因 此 , 原 R- 型 指令 的 数据 通路 不 需要 改动 ,而 只 要 增加 
ALU 结果 送 PC 的 数据 通路 ,并 对 控制 信号 作 相应 修改 即 可 。 具 体 修 改 如 下 。 

(1) PC 的 输入 端 再 增加 一 个 来 源 : ALU 输出 ,因此 ,在 PC 输入 端 需 再 加 一 个 多 路 选 
择 器 MUX, 原先 的 输入 作为 MUX 其 中 的 一 个 输入 , 另 一 个 输入 为 ALU 输出 。 

(2) 增加 一 个 控制 信号 JReturn, 用 于 对 新 加 MUX 进行 控制 ,执行 jr 指令 时 ,JReturn 王 1， 
选择 ALU 输出 送 PC; 执 行 其 他 指令 时 ,JReturn= 王 0, 选 择 原来 的 输入 值 送 PC。 

(3) ALU 控制 器 中 增加 func 一 001000B 时 相应 的 译 码 输出 ,其 输出 控制 信号 取 值 为 
ALUctr 一 add。 

13. 假设 MIPS 指令 系统 中 有 一 条 工 型 带 符号 整数 比较 指令 “bgt rs, rt, imm16”, 其 功 
能 为 : 若 R[rs]>RrIrt] 则 PC 二 PC 十 4 十 imm16X4, 否 则 PC 一 PC 十 4。 

若 ALU 能 产生 ZF( 零 ) SF( 符 导 ) 和 OF( 溢 出 ) 三 个 标志 的 输出 ,请 在 图 6. 6 所 示 的 多 
周期 数据 通路 中 增加 实现 bgt 指令 的 数据 通路 ,并 给 出 指令 在 执行 周期 中 相应 的 控制 信号 
取 值 。 

【分 析 解 答 】 

比较 指令 需要 对 两 个 寄存 器 rs 和 rt 中 的 内 容 做 减法 运算 (用 ALU 中 的 加 法 器 实现 )， 
ALU 根据 运算 结果 得 到 ZF、SF 和 OF 三 个 标志 信息 。 在 此 ,rs 和 rt 中 的 内 容 被 看 成 带 符 
号 整数 ,因此 ,判断 人 [rs] 之 R[rt] 的 条 件 表 达 式 为 ZF ， (SF 田 OF)。 图 6.6 中 的 多 周期 数 
据 通路 已 能 支持 beq 指令 的 执行 ,而 beq 指令 和 bgt 指令 的 目标 转移 地 址 是 一 样 的 ,因此 ， 
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只 要 在 图 6. 6 中 原先 beq 指令 的 条 件 判 断 逻 辑 基 础 上 增加 bgt 指令 的 条 件 判 断 逻 辑 即 可 ， 
修改 后 的 数据 通路 如 图 6. 13 所 示 , 其 中 带 阴 影 部 分 是 修改 或 增加 的 数据 通路 。 
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图 6.13 增加 了 bgt 指令 的 多 周期 数据 通路 


在 多 周期 数据 通路 中 ,bgt 指令 与 beq 指令 一 样 , 都 需要 3 个 时 钟 周期 ,前 两 个 时 钟 周 
期 为 取 指 周期 和 译 码 / 取 数 周期 ,它们 在 所 有 指令 的 执行 过 程 中 都 是 一 样 的 ,第 3 个 周期 为 
执行 周期 ,在 此 周期 中 ,各 控制 信号 的 取 值 为 beq 二 PCWr 一 MemWr 二 IRWr 一 RegWr 
BrWr= R-type=0,bgt=ALUSelA=1,ALUSelB=00, ALUOp= sub, PCSource 二 10, 其 余 
任意 。 

14. 已 知 MIPS 中 有 一 条 lui(Load Upper Immediate) 指 令 ,其 指令 格式 如 下 : 
31 26 25 21 20 16 15 0 
001111 | 00000 人 imm16 

其 功能 是 将 立即 数 imm16 送 到 rt 寄存 器 的 高 16 位 , 低 16 位 补 0。 若 使 图 6. 6 所 示 的 
多 周期 数据 通路 也 能 执行 lui 指令 , 则 如 何 修改 该 多 周期 数据 通路 ? 需要 增加 什么 控制 信 
号 ? 该 指令 对 应 的 时 钟 周期 数 是 多 少 ? 除 取 指 周期 和 译 码 / 取 数 周期 外 的 其 他 周期 中 控制 
信和 号 的 取 值 是 什么 ? 

【分 析 和 解答】 

lui 指令 采用 工 型 指令 格式 ,其 中 rs 二 $0。 该 指令 的 功能 可 以 描述 成 R[rt] 一 
RL $0j 十 imm16X2*。 因 此 ,只 要 在 图 6.6 中 对 原 扩展 器 稍 加 修改 ,然后 借助 工 型 运算 类 
指令 数据 通路 就 可 实现 lui 指令 。 具 体 修改 如 下 。 


(1) 修改 原 扩展 器 ,使 其 具有 高 位 零 扩展 ,高 位 符号 扩展 和 低位 零 扩 展 3 种 扩展 功能 。 

(2) 控制 信号 ExtOp 从 原来 的 1 位 扩展 为 2 位 ,用 于 控制 扩展 器 进行 3 种 扩展 操作 。 
可 以 定义 ExtOp 一 01 时 进行 高 位 零 扩 展 ;ExtOp 一 10 时 进行 高 位 符号 扩展 ;ExtOp 一 11 时 
进行 低位 零 扩展 。 

该 指令 的 执行 过 程 同 型 运算 类 指令 ,因此 ,与 ori 指令 类 似 , 其 时 钟 周期 数 为 4。 第 3 个 
时 钟 周期 各 控制 信号 取 值 为 ALUSelA==1, ALUSelB=10, ALUOp==add, ExtOp=11， 
MemtoReg 一 RegDst 一 RegWr 一 PCWr 一 PCWrCond 一 卫 Wr 一 MemWr 一 BrWr 一 R-type 一 0, 其 余 任 
意 ;第 4 个 时 钟 周期 各 控制 信号 取 值 为 ALUSelA 二 RegWr==1, ALUSelB=10, ALUOp==add， 
ExtOp 王 11,MemtoReg 一 RegDst 王 PCWr 王 PCWrCond 王 IRWr 王 MemWr 一 BrWr 一 R-type 一 0, 其 
余 任意 。 

15. 假定 图 6.6 所 示 的 多 周期 数据 通路 中 寄存 器 堆 只 有 一 个 读 口 和 一 个 写 口 , 若 要 完 
成 和 原 数据 通路 相同 的 功能 , 则 需要 对 图 中 原 数 据 通路 做 哪些 修改 ? 与 之 对 应 的 有 限 状 态 
机 又 如 何 修改 ? 每 条 指令 的 时 钟 周期 数 有 什么 变化 ? 

【分 析 解 答 】 

如 果 图 6. 6 所 示 的 多 周期 数据 通路 中 寄存 器 堆 改 成 只 有 一 个 读 口 ,那么 ,原来 可 以 同时 
读数 据 到 A 和 B, 现 在 只 能 先 读 一 个 到 A, 再 读 一 个 到 B。 

由 于 A 和 B 共 用 一 个 读 地 址 端口 ,所 以 在 读 地 址 端口 的 输入 端 要 加 一 个 多 路 选择 器 及 
其 控制 信号 RegRead, 用 于 选择 读 地 址 口 是 rs 还 是 rt。 可 以 定义 当 RegRead 二 0 时 读 口 地 
址 为 rs, 当 RegRead 一 1 时 读 口 地 址 为 rt。 

由 于 只 有 一 个 读数 据 端 口 ,该 端口 的 数据 可 能 被 送 到 A, 也 可 能 被 送 到 B, 所 以 读数 据 
端口 的 输出 同时 连 到 A 和 B 的 输入 端 ,并 增加 一 个 控制 信号 AWr,A 和 B 两 个 寄存 器 也 各 
自 增 加 一 个 “ 写 使 能 ”控制 端 。 可 以 定义 当 AWr=1 时 将 端口 数据 送 A, 在 AWr 王 0 时 将 端 
口 数据 送 B。 因 此 ,在 数据 通路 中 ,AWzr 信号 直接 连 到 A 的 “ 写 使 能 ” 线 , 而 将 AWr 信号 取 
反 后 连 到 B 的 “ 写 使 能 ” 线 。 

由 于 每 个 时 钟 周 期 只 能 读 取 一 个 操作 数 , 修 改 后 的 数据 通路 不 能 像 原先 的 数据 通路 屠 
样 ,在 第 2 个 周期 ( 译 码 / 取 数 周期 ) 中 同时 读 取 rs 和 rt, 必须 修改 相应 的 有 限 状 态 机 。 可 以 
有 以 下 3 种 修改 方式 。 

(1) 将 原来 的 译 码 / 取 数 周期 再 分 成 两 个 周期 ,分 别 读 rs 到 A 和 读 rt 到 B, 并 在 其 中 一 
个 周期 中 投机 完成 转移 地 址 计算 。 这 样 ,每 条 指令 的 执行 都 多 了 一 个 时 钟 周期 。 

(2) 在 原来 的 译 码 / 取 数 周期 中 先 读 rs 到 A, 对 于 R- 型 和 Branch 类 指令 ,再 增加 一 个 
周期 来 读 rt 到 B; 对 于 其 他 不 需 用 到 rt 内 容 的 指令 , 则 无 须 增加 新 的 周期 。 这 样 ,对 于 每 个 
R- 型 和 Branch 类 指令 的 执行 ,都 会 多 一 个 时 钟 周 期 ,而 其 他 指令 的 时 钟 周期 数 不 变 。 

(3) 在 原来 的 译 码 / 取 数 周期 中 先 读 rt 到 B, 这 样 ,对 于 R- 型 指令 、Branch 类 指令 、 
Load/Store 类 指令 和 ori 指令 等 都 要 再 增加 一 个 周期 用 于 读 rs 到 A。 

显然 ,上 述 3 种 方式 中 ,第 (2) 种 做 法 得 到 的 综合 CPI 最 小 。 

16. 某 高 级 语言 源 程序 中 的 一 个 while 语句 为 “while (save[ 让 二 二 k ) i 十 二 1;”, 若 对 
其 编译 时 ,编译 器 将 i 和 分 别 分 配 在 寄存 器 $s3 和 $s5 中 ,数组 save 的 基 址 存放 在 $s6 
中 , 则 生成 的 MIPS 汇编 代码 段 如 下 。 


由 oop: S11l S$t1l, $s3, 2 #RISt1]<—RI$s3]<<2, 妇 RIS$t1]=iX4a 
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2 add S$tl, $tl, $s6  #R[I$t1l]<RI$t1l]+R[$s6],B RI$t1]=Address of save[i] 
3 1w $t0, 0($t1) #RIS$tTtO0]<MIRI$t1]+0],B RIS$t0]=save [i] 

4 bne S$t0, $s5, exit  #if RI[St0] 关 RIS$s5] then goto exit 

5 addi $s3, $s3,1 #R[$s3]<—R[$s3]+1,B i=i+1 

6 j loop #goto loop 

和 exit: 


假定 图 6.4 所 示 单 周期 数据 通路 和 图 6. 6 所 示 的 多 周期 数据 通路 中 各 主要 功能 单元 的 
操作 时 间 分 别 为 : 存储 器 200ps;ALU 和 加 法 器 100ps; 寄 存 器 堆 ( 读 或 写 )50ps。 在 不 考虑 
多 路 选择 器 、 控 制 单元 PC、 扩展 器 和 线路 等 延迟 的 情况 下 , 单 周 期 和 多 周期 处 理 器 的 时 钟 
周期 至 少 各 为 多 少 ? 若 上 述 程序 段 共 循 环 执行 8 次 , 则 在 单 周期 数据 通路 和 多 周期 数据 通 
路 中 执行 各 需要 多 少 纳 秒 ? 

【分 析 解 答 】 

单 周期 处 理 器 的 时 钟 周期 至 少 为 200 十 50 十 100 十 200 十 50 二 600ps; 多 周期 处 理 器 的 时 
钟 周期 至 少 为 200ps。 对 于 单 周 期 数据 通路 中 的 8 次 循环 执行 ,第 1~4 条 指令 执行 了 8 次 ， 
第 5~6 条 指令 执行 了 7 次 ,因此 ,共用 了 (4X8 十 2X7)X600 王 27600ps 一 27. 6ns。 对 于 多 
周期 数据 通路 中 的 8 次 循环 执行 ,slladd 和 addi 指令 都 需要 4 个 时 钟 周期 ,bne 和 j 指令 需 
要 3 个 时 钟 周 期 ,lw 指令 需要 5 个 时 钟 周 期 ,因此 ,一 共用 了 (4 十 4 十 5 十 3) X8X200 十 
(4 十 3) X7X200 一 35400ps 一 35. 4ns。 

17. 时 钟 周期 和 CPI 这 两 个 重要 参数 对 处 理 器 性 能 起 着 非常 关键 的 作用 ,因而 在 处 理 
器 设计 中 需要 对 这 两 个 参数 进行 权衡 。 有 些 设计 者 偏向 以 增 大 CPI 为 代价 换取 较 高 的 主 
频 ,而 另外 一 些 设计 者 则 偏向 以 较 低 主 频 换取 CPI 值 的 降低 。 假 设 在 不 同 指导 思想 下 设计 
出 的 两 种 不 同 处 理 器 如 下 : 

M1: 多 周期 处 理 器 ,数据 通路 结构 类 似 图 6. 6 所 示 结 构 , 所 不 同 的 是 , 它 将 写 寄 存 器 与 
存储 器 读 或 ALU 计算 合 在 同一 个 时 钟 周期 内 进行 , 主 频 为 3GHz。 

M2: 多 周期 处 理 器 ,数据 通路 结构 类 似 M1, 所 不 同 的 是 , 它 进 一 步 将 有 效 地 址 计算 和 
存储 器 操作 合 在 同一 个 时 钟 周期 内 进行 ,因而 延长 了 一 个 节拍 内 的 关键 路 径 , 主 频 降低 为 
2.5GHz。 

已 知 基 准 程序 CPUint 2000 中 各 类 指令 的 频率 为 Load 25% ,Store 10% ,Branch 11%， 
Jump 2%,ALU 52% 。 以 基准 程序 CPUint 2000 为 标准 , 比较 两 种 不 同 处 理 器 的 性 能 ,说 
明 哪 个 处 理 器 性 能 更 好 。 找 到 一 种 指令 序列 组 合 , 使 得 用 它 来 评测 时 某 个 处 理 器 性 能 明显 
比 另 一 个 高 。 

【分 析 解 答 】 

参考 图 6.6 所 对 应 的 有 限 状态 转换 图 6. 7, 对 M1 和 M2 进行 分 析 , 得 到 如 下 结果 : 
Load、Store、Branch、Jump 和 ALU 五 类 指令 在 M1 中 的 CPI 分 别 为 4.4、3、3、3, 在 M2 中 
的 CPI 分 别 为 3、3、3、3、3。 因 此 ,M1 和 M2 的 综合 CPI 分 别 为 : 

CPICM]1) = 25% X4++10% XxX4+11% X3+2% X3+52% XX3= 3.35 
CPIC(M2) = 25% X310% X3++11%X3++2% X352%X3=3 
因此 ,M1 和 M2 的 MIPS 数 分 别 为 : 
MIPS(M1) = 3G/3. 35 一 895.5 


MIPSCM2) = 2.5G/3 = 833.3 

M1 和 M2 分 别 对 图 6. 6 所 示 的 数据 通路 做 了 不 同 的 改变 ,显然 ,Ml 的 做 法 效果 更 好 。 
但 当 所 有 指令 都 是 Load/Store 指令 时 ,M2 的 CPI 还 是 3, 但 M1 的 CPI 变 为 4, 其 MIPS 数 
为 3G/4 二 750。 显 然 , 这 种 情况 下 M2 的 性 能 比 M1 高 。 

18. 对 于 多 周期 MIPS 处 理 器 , 若 将 数据 访问 过 程 分 成 两 个 时 钟 周 期 , 则 可 使 时 钟 频率 
从 4.8GHz 提高 到 5. 6GHz, 但 会 增加 lw 和 sw 指令 的 时 钟 周期 数 。 已 知 基准 程序 CPUint 
2000 中 各 类 指令 的 频率 为 Load 25%% ,Store 10%% ,Branch 11% ,Jump 2% ,ALU 52%。 若 
以 基准 程序 CPUint 2000 为 标准 , 则 时 钟 频率 提高 后 处 理 器 的 性 能 提高 了 多 少 ? 若 将 取 指 
令 过 程 再 分 成 两 个 时 钟 周 期 , 则 可 进一步 使 时 钟 频率 提高 到 6. 4GHz, 此 时 ,时 钟 频 率 的 提 
高 是 否 也 能 带 来 处 理 器 性 能 的 提高 ? 为 什么 ? 

【分 析 解 答 】 

假设 M1、M2 和 M3 分 别 表示 时 钟 频率 为 4. 8GHz、5. 6GHz 和 6. 4GHz 的 多 周期 处 理 
器 ,对 如 图 6.7 所 示 的 有 限 状态 转换 图 进行 分 析 得 知 ,Load、Store、Branch、Jump 和 ALU 类 
指令 在 M1 中 的 CPI 分 别 为 5、4、3、3、4, 在 M2 中 的 CPI 分 别 为 6.5、3、3、4, 在 M3 中 的 CPI 
分 别 为 7.6、4、4、5。 因 此 ,用 基准 程序 CPUint 2000 来 计算 ,得 到 它们 的 综合 CPI 分 别 为 : 

CPI(M1) = 25% X5+10% X4+11% X3+2% X3+52% X4 一 4.12 
CPICM2) = 25% X 6+10% X5+11% XxX3+2% XxX3+52% xX4 = 4.47 
CPICM3) = 25% X7+10% X6+11% X4+2% xX4+52% xX5 一 5.47 
因此 ,M1、M2 和 M3 的 MIPS 数 分 别 为 : 
MIPSCM1) = 4.8G/4. 12 = 1165 
MIPSCM2) = 5. 6G/4.47 = 1253 
MIPSCM3) = 6.4G/5.47 = 1170 

由 此 可 见 ,M2 中 将 数据 访问 改 为 双 周 期 的 做 法 效果 较 好 。M3 中 进一步 把 取 指 令 改 为 
双 周 期 的 做 法 反而 使 MIPS 数 变 小 了 ,因此 ,这 种 做 法 不 可 取 。 产 生 上 述 结果 的 原因 在 于 ， 
数据 访问 只 涉及 Load/Store 指令 ,而 取 指 令 则 涉及 所 有 指令 ,使 得 CPI 显著 增 大 ,从 而 降低 
了 性 能 。 

19. 假定 有 一 条 MIPS 伪 指 令 “bemp $tl1，$t2，$t3”, 其 功能 是 实现 对 两 个 主 存 块 数 
据 的 比较 。$tl 和 $t2 中 分 别 存放 两 个 主 存 块 的 首 地 址 , $t3 中 存放 数据 块 的 长 度 , 每 个 
数据 占 一 个 字 (4 个 字 节 )。 若 所 有 数据 都 相等 , 则 将 0 置信 $tl; 和 否则 ,将 第 一 次 出 现 不 相 
等 时 的 地 址 分 别 置 人 $tl 和 $t2 并 结束 比较 。 

(1) 若 $tt 和 $t5 是 两 个 空闲 寄存 器 , 请 给 出 利用 $tt 和 $t5 实现 该 伪 指 令 的 指令 
序列 。 

(2) 假定 比较 的 数据 块 大 小 为 50 个 字 , 说 明 在 类 似 于 图 6. 6 所 示 的 多 周期 数据 通路 中 
执行 该 伪 指 令 时 最 多 需要 多 少 个 时 钟 周期 。 


【分 析 和 解答】 
(1) 实现 伪 指 令 “bcmp $tl，$t2，$t3? 的 指令 序列 如 下 。 

beq $t3, $zero, done # 若 数据 块 长 度 为 0, 则 结束 
compare:; lw S$t4, 0($t1) # 块 1 的 当前 数据 取 到 $t4 


lw S$t5, 0($t2) # 块 2 的 当前 数据 取 到 $t5 
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bne $t4, $t5, done #$t4 和 $t5 的 内 容 不 等 , 则 结束 
addi $tl1, St1，4 # 块 1 中 的 当前 数据 指向 下 一 个 
addi $t2, $t2, 4 # 块 2 中 的 当前 数据 指向 下 一 个 
addi $t3, $t3, -1 # 比 较 次 数 减 1 

bne $t3, $2zero, compare # 若 没有 全 部 比较 完 , 则 继续 比较 
addi $t1, $zero, 0 # 若 全 部 都 相等 , 则 将 $t1 置 0 


done: 


(2) 在 类 似 图 6. 6 所 示 的 多 周期 数据 通路 中 执行 时 ,上 述 程序 段 中 用 到 的 指令 beq、lw、 
bne 和 addi 的 时 钟 周 期 数 分 别 为 3、5、3 和 4。 若 比较 的 数据 块 大 小 为 50 个 字 , 则 上 述 指令 
序列 中 的 循环 最 多 被 执行 50 次 ,因而 所 需要 的 指令 数 最 多 为 1 十 50X7 十 1 二 352。 其 中 ， 
Load 指令 为 50X2==100 条 ,时 钟 周 期 数 为 5X100 王 500; Branch 指令 数 为 1 十 2X50 王 101, 时 
钟 周 期 数 为 3X101 二 303;addi 指令 数 为 1 十 3X50 王 151, 时 钟 周期 数 为 4X151=604。 所 以 ， 
总 时 钟 周期 数 最 多 为 500 十 303 十 604 一 1407。 

20. 在 一 个 指令 集中 增添 功能 强大 的 复杂 指令 时 ,通常 使 用 微 程序 方式 对 这 些 复 杂 指 
令 进 行 控制 。 如 果 要 求 在 图 6.6 所 示 的 多 周期 数据 通路 中 采用 微 程 序 控制 方式 实现 第 
19 题 中 的 “bemp rs，rt,，rd” 指 令 ,并 且 规 定 使 用 通用 寄存 器 作为 两 个 额外 临时 寄存 器 rtl 
和 rt2 。 

(1) 请 给 出 全 套 的 设计 方案 ,包括 该 指令 的 汇编 形式 、 机 器 码 格式 (与 原 有 指令 格式 兼 
容 )、 指 令 执行 流程 (用 RTL 表示 )、 数 据 通路 修改 方案 、 控 制 信号 增加 或 修改 方案 、 指 令 执 
行 对 应 的 有 限 状 态 机 等 。 

(2) 与 第 19 题 的 软件 实现 方式 相 比 ,该 指令 用 硬件 实现 时 的 速度 快 了 多 少 ? 硬件 实现 
速度 快 的 原因 是 什么 ? 

(3) 能 否 用 单 周 期 数据 通路 实现 ?假定 能 , 则 用 软件 实现 合算 还 是 用 硬件 实现 合算 ? 

(4) 如 果 rtl 和 rt2 不 用 通用 寄存 器 ,而 是 用 内 部 寄存 器 , 则 会 有 哪些 好 处 ? 

【分 析 解 答 】 

(1) 该 指令 的 汇编 形式 为 “bcmp rs，, rt, rd, rtl, rt2”。 

该 指令 的 机 器 码 格式 如 下 。 其 中 6 位 OP 字段 可 以 选择 一 个 未 被 其 他 指令 使 用 的 
编码 。 


31 2625 2120 1615 1110 65 1 0 
Op IS nt rd rtl rt2 0 


指令 的 功能 : 比较 个 数 由 rd 指出 ,如 果 rd 的 内 容 为 0 则 什么 都 不 做 ,继续 执行 下 一 条 
指令 ,否则 ,对 rs 和 rt 所 指 内 存单 元 的 数据 依次 比较 ,直到 发 生 以 下 情况 为 止 。@ 若 存在 一 
对 数据 不 相等 , 则 将 不 相等 的 数据 所 在 的 内 存单 元 地 址 分 别 保存 在 rs 和 rt 中 ,结束 执行 ; 
@ 若 所 有 数据 都 相等 , 则 将 0 存放 在 rs 中 ,结束 执行 。rtl 和 rt2 是 临时 寄存 器 ,在 指令 执行 
过 程 中 ,rs、rt、rd、rtl 和 rt2 都 会 被 破坏 。 

该 指令 执行 流程 如 图 6. 14 所 示 。 

对 图 6.6 所 示 的 数据 通路 和 控制 信号 做 以 下 修改 ,以 支持 该 指令 的 执行 。 

@ 在 存储 器 的 Adr 处 对 原 MUX 进行 修改 ,增加 有 [rs]( 在 A 中 ) 和 R[rt]( 在 了 中 ) 两 
个 输入 , 原 控 制 信号 IorD 改 为 2 位 , 当 IorD 为 0.1.2 和 3 时 ,分 别 将 PC、 ALUout、\A 和 BB 


RErtl] 一 MIR[rs]l, Rro] 一 MIR[rtl 


un 


EI 
起 


R[rs]--R[rsl+4.Rrl- 一 R[rtd+4 


Rfed]--R[rd]-1 


1 是 
Rrrs] 一 0 


图 6.14 指令 执行 流程 图 


送 Adr 处 。 

@ 在 寄存 器 堆 的 Ra 处 增加 一 个 MUX, 除 原来 的 rs 外 ,增加 rt、rd、rtl 三 个 输入 端 ,并 
相应 地 增加 2 位 控制 信号 RdAddl。 当 RdAddl 为 0、1、2 和 3 时 ,寄存 器 读 地 址 分 别 为 rs、 
rt\rd 和 rtl 。 

@ 在 寄存 器 堆 的 Rb 处 增加 一 个 MUX, 除 原来 的 rt 外 , 另 一 个 输入 来 自 rt2, 同 时 增加 
相应 的 1 位 控制 信号 RdAdd2, 当 RdAdd2 为 0 和 1 时 ,寄存 器 读 地 址 分 别 为 rt 和 rt2。 

@ 在 寄存 器 堆 的 Rw 处 对 原 MUX 进行 修改 ,除了 原来 的 rt 和 td 外 ,增加 rs、rtl 和 
rt2 三 个 输入 , 原 控制 信号 RegDst 改 为 3 位 , 当 RegDst 为 0、1、2、3、4 时 ,寄存 器 写 地 址 分 
别 为 rs\rt\rd\rtl 和 rt2。 

@ 在 寄存 器 堆 的 Dw 处 对 原 MUX 进行 修改 ,除了 原来 的 输入 以 外 ,增加 一 个 输入 端 
“0”, 原 控制 信号 MemtoReg 改 为 2 位 , 当 MemtoReg 为 0、1 和 2 时 , 存 人 寄存 器 的 内 容 分 
别 为 ALU 输出 结果 、 存 储 器 读 出 数据 和 0。 

@@ 在 ALU 的 BB 输入 端 处 对 原 MUX 进行 修改 ,再 增加 两 个 输入 “0” 和 “1”, 以 使 ALU 
能 执行 “RLrd] 一 0” 和 “RLrdj] 一 1” 的 操作 ,这 样 , 原 控制 信号 ALUSelB 改 为 3 位 ,ALUSelB 
为 0、1.2、3 时 ,原先 的 定义 不 变 ,ALUSelB 为 4 和 5 时 ,ALU 的 BB 输入 端 分 别 为 0 和 1。 

根据 该 指令 执行 流程 ,以 及 相应 数据 通路 和 控制 信号 的 定义 ,得 到 该 指令 执行 过 程 对 应 
的 状态 转换 图 ,如 图 6. 15 所 示 。 图 中 在 每 个 状态 内 仅 给 出 了 关键 控制 信号 的 取 值 ,并 省 略 
了 最 初 的 两 个 公共 状态 ( 取 指 令 周 期 和 译 码 / 取 数 周期 ) 以 及 其 他 指令 执行 的 状态 (参见 
图 6.7)。 该 指令 的 执行 从 第 12 状态 开始 ,每 个 状态 按 顺序 编导 ,分 别 为 12、13、…、25。 

图 6.7 对 应 的 原 11 条 指令 的 有 限 状 态 机 已 有 12 个 状态 和 两 个 分 支点 。 加 上 该 指令 的 
3 个 分 支点 ,新 的 有 限 状 态 机 中 有 5 个 分 支点 和 26 个 状态 ,如 果 用 微 程序 设计 方式 实现 该 
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RdAddl=10 
ALUSelA=1 
ALUSelB=100 
ALUOp=Sub 
PCWrCond=0 


MemRead 
TorD=10 


RegDst=011 
MemtoReg=01 
RegWr 


MemRead 
TorD=11 


RegDst=100 
MemtoReg=01 
RegWr 


ZF=0 


RdAddl-11 
RdAdd2=1 
ALUSelA=1 
ALUSelB=000 20 


ALUOp=Sub RadAddlol 3 
ALUSelB=001 
RdAddI=00 19 ALUOp=add feeps-007 
ALUSelB=001 MemtoReg=00 


ALUOp=add RegDst-000 RegWr 


MemtoReg=00 
ReeWwr_/ 24 
ZF=0 RdAddl-10 


ALUSelB=100 
ALUOp=sub, 


RdAddl=10 
ALUSelB=101 
ALUOp=sub 


RegDst=010 
MemtoReg=00 
RegWr 


ZE=1 


RegDst=000 


MemtoReg=10 
~ 


图 6.15 指令 执行 的 有 限 状 态 转换 图 


指令 的 控制 逻辑 ,每 个 状态 对 应 一 条 微 指令 ,那么 , 微 指令 地 址 应 该 有 5 位 ,转移 控制 字段 
BrCtr 的 位 数 为 3, 其 编码 及 含义 如 下 (Next paddr 为 下 一 条 微 指令 地 址 ) 。 


000 Next haddr=0 

001 Next paddr=ROM] 中 对 指令 译 码 得 到 的 相应 人 口 地 址 
010 Next paddr=ROM2 中 lw/sw 对 应 的 人 口 地 址 

011 Next pyaddr=paddr+1 


100 Next paddr= 该 指令 分 支 1 处 输出 的 地 址 
101 Next paddr= 该 指令 分 支 2 处 输出 的 地 址 
110 Next paddr= 该 指令 分 支 3 处 输出 的 地 址 


执行 到 该 指令 时 , 则 调 出 该 指令 对 应 的 微 程序 执行 。 该 指令 对 应 的 微 程 序 是 从 第 12 状 
态 开始 的 微 指令 序列 。 其 中 的 3 个 分 支点 分 别 在 第 12、17 和 24 状态 ,都 是 根据 标志 ZF 控 
制 分 支 的 。 对 于 第 12 状态 的 分 支 1, 若 ZF 二 1, 则 Next paddr 二 0, 否 则 Next pnaddr 一 pnaddr 十 1; 
对 于 第 17 状态 的 分 支 2, 若 ZF 二 0, 则 Next paddr 二 0, 否 则 Next paddr 一 paddr 十 1; 对 于 第 
24 状态 的 分 支 3, 若 ZF 二 0, 则 Next paddr 王 01101 ,否则 Next pnaddr 王 paddr 十 1。 因 此 ,分 
支 1 和 分 支 2 处 可 以 各 用 一 个 MUX 实现 ,根据 ZF 的 值 选择 将 0 还 是 jaddr 十 1 输出 作为 


史 洋 处理 器 


Next paddr 的 值 。 分 支 3 处 用 一 个 地 址 修改 逻辑 , 当 ZF 一 0 时 ,将 输入 11001 改 为 01101， 
ZF 一 1 时 不 修改 。 对 应 的 下 一 条 微 地 址 生成 逻辑 如 图 6. 16 所 示 ,在 此 假定 采用 计数 器 法 。 


IR[31-26] 


图 6.16 题 20 中 的 下 一 条 微 地 址 生成 多 辑 


(2) 假定 bemp 指令 的 比较 次 数 为 n( 隆 0) ,根据 上 述 有 限 状态 机 可 知 , 最 坏 情 况 下 用 硬 
件 实 现 该 指令 所 需要 的 时 钟 周期 数 为 2 十 1 十 12n 十 1 二 4 十 12n; 而 根据 第 19 题 给 定 的 指令 
序列 可 知 , 最 坏 情况 下 用 软件 实现 所 需要 的 时 钟 周期 数 为 10n 十 (3 十 6n) 十 (4 十 12n) 二 7 十 
28n。 因 此 ,硬件 实现 比 软件 实现 至 少 快 一 倍 多 。 硬 件 实现 比 软件 快 的 原因 主要 有 两 个 : 
四 软件 方式 下 ,指令 序列 中 的 每 条 指令 都 要 取 指 令 、 译 码 / 取 数 ,而 硬件 实现 时 不 需要 。 四 软 
件 方式 下 ,每 条 指令 都 要 保存 结果 ,下 一 条 指令 用 时 再 取 , 而 硬件 方式 下 ,中 间 数 据 可 以 直接 
使 用 ,无 须 先 存 后 取 。 

《3) 因为 本 指令 在 执行 过 程 中 需要 多 次 写 寄存 器 ,因此 ,不 能 用 单 周期 数据 通路 实现 。 
假设 能 用 ,因为 单 周期 数据 通路 的 时 钟 周期 以 最 复杂 指令 为 准 , 因 此 ,这 个 复杂 指令 会 大 大 
延长 时 钟 周期 ,此 时 ,用 软件 实现 更 合算 。 

《4) 如 果 rtl 和 rt2 不 用 在 指令 中 明显 给 出 , 即 不 用 通用 寄存 器 而 改 用 内 部 寄存 器 , 则 
可 大 大 简化 数据 通路 减少 控制 信号 和 时 钟 周 期 数 , 并 且 可 减少 被 该 指令 破坏 的 通用 寄存 器 
的 个 数 。 

21. 假设 微 程序 控制 器 容量 为 1024 X48 位 , 微 程 序 可 在 整个 控 存 内 实现 转移 ,反映 所 
有 指令 执行 状态 转换 的 有 限 状态 机 中 有 4 个 分 支点 ,采用 水 平 型 微 指令 格式 ,并 采用 断定 法 
确定 下 一 条 微 地 址 , 即 由 专门 的 下 地 址 字段 确定 微 地 址 。 请 设计 微 指 令 的 格式 ,说 明 各 字段 
的 含义 和 位 数 , 并 对 转移 控制 字段 进行 编码 。 

【分 析 解 答 】 

微 程 序 控制 器 容量 为 1024 X 48 位 ,说 明 微 地 址 10 位 , 微 指令 字 48 位 。 微 指令 字 分 
3 个 字段 : 微 命令 字段 .转移 控制 字段 和 下 地 址 字段 。 因 为 微 地 址 占 10 位 ,所 以 下 地 址 字段 
有 10 位 ,用 来 给 出 下 条 微 指令 的 地 址 ;因为 需要 对 5 种 情况 进行 控制 ,所 以 转移 控制 字段 有 
3 位 ; 剩 下 的 48 一 10 一 3 二 35 位 是 微 操作 码 ( 微 命令 ) 字 段 ,用 于 对 微 命令 进行 编码 。 

采用 断定 法 时 ,转移 控制 字段 可 按 以 下 方案 进行 编码 。 


| 章 
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000: 下 地 址 字段 指出 的 地 址 作为 下 一 条 微 地 址 

100: 根据 分 支 1 处 的 条 件 来 选择 下 一 条 微 地 址 

101: 根据 分 支 2 处 的 条 件 来 选择 下 一 条 微 地址 

110: 根据 分 支 3 处 的 条 件 来 选择 下 一 条 微 地 址 

111: 根据 分 支 4 处 的 条 件 来 选择 下 一 条 微 地 址 

如 果 采 用 计数 器 法 , 则 转移 控制 字段 需要 对 6 种 情况 进行 控制 ,在 上 述 5 种 情况 的 基础 
上 再 加 上 “顺序 执行 下 一 条 微 指 令 ” 的 情况 。 其 中 第 一 种 情况 改 为 “ 取 指 微 程序 首 地 址 作为 
下 一 条 微 地 址 ”。 此 时 ,转移 控制 字段 也 只 要 3 位 编码 。 

22.， 对 于 多 周期 CPU 的 异常 和 中 断 处 理 , 回 答 以 下 问题 : 

(1) 对 于 除数 为 0、 洲 出、 无 效 指令 操作 码 、 无 效 指令 地 址 、 无 效 数据 地 址 、 缺 页 访问 越 
权 和 外 部 中 断 ,CPU 在 哪些 指令 的 哪个 时 钟 周期 能 分 别 检测 到 这 些 异 常 或 中 断 ? 

(2) 在 检测 到 某 个 异常 或 中 断后 ,CPU 通常 要 完成 哪些 工作 ? 简要 说 明 CPU 如 何 完 
成 这 些 工作 。 

《3) TLB 缺失 和 cache 缺失 各 在 哪个 指令 的 哪个 时 钟 周期 被 检测 到 ? 如 果 检 测 到 发 生 
了 TLB 缺失 和 cache 缺失 ,那么 ,CPU 各 要 完成 哪些 工作 ? 简要 说 明 CPU 如 何 完 成 这 些 工 
作 。( 提 示 : TLB 缺失 可 以 有 软件 和 硬件 两 种 处 理 方式 ) 

【分 析 解 答 】 

(1) 多 周期 CPU 中 不 同 指令 执行 时 可 能 会 发 生 不 同 的 异常 事件 ,这些 异常 事件 发 生 在 
不 同 的 时 间 ,CPU 在 不 同 的 时 钟 周期 检测 不 同 的 异常 事件 。 

Q@ “除数 为 0 异常 在 取 数 / 译 码 周期 进行 检测 。 

加 “溢出 ”异常 在 R- 型 指令 和 工 型 运算 类 指令 的 执行 周期 进行 检测 。 

@ “无效 指令 ”异常 在 取 数 / 译 码 周 期 进行 检测 。 

@ “无 效 指令 地 址 ”“ 缺 页 ”和 “访问 越权 ”异常 在 取 指 令 周 期 检测 。 

@ “无效 数 据 地 址 ”“ 缺 页 ”和 “访问 越权 ”异常 在 存储 器 访问 周期 检测 。 

@“ 外 部 中 断 ” 可 在 每 条 指令 的 最 后 一 个 周期 进行 检测 。 

《2) CPU 检测 到 某 个 异常 或 中 断后 ,要 完成 的 工作 是 关中 断 、 保 护 断 点 和 程序 状态 、 识 
别 异常 事件 (或 中 断 源 ) 并 转 异 常 ( 或 中 断 ) 处 理 。 

CPU 通过 将 中 断 允 许 触发 器 清 0 来 关中 断 ;计算 断 点 值 并 将 断 点 和 程序 状态 字 寄 存 器 
信息 送 到 堆栈 或 特定 的 寄存 器 中 ;异常 的 原因 和 外 部 中 断 源 可 以 采用 软件 识别 或 硬件 识别 
方式 进行 识别 。 

(3) TLB 缺失 和 cache 缺失 都 是 在 存储 访问 过 程 中 发 生 的 ,因而 这 两 种 缺失 在 相同 的 
周期 内 进行 检测 。 与 存储 访问 相关 的 周期 有 每 个 指令 的 取 指 令 (IF) 周 期 \lw 指令 和 sw 指 
令 的 存储 器 访问 (Mem) 周 期 。 对 于 TLB 缺失 ,可 以 有 硬件 和 软件 两 种 处 理 方式 ,如 果 是 硬 
件 处 理 TLB 缺失 , 则 在 CPU 中 有 专门 处 理 TLB 缺失 的 逻辑 部 件 ,能 够 启动 一 次 存储 器 读 
操作 ,到 主 存 读 取 相 应 的 页 表 项 内 容 装 人 TLB; 如 果 是 软件 处 理 TLB, 则 在 CPU 检测 到 发 
生 了 TLB 缺失 的 情况 下 ,就 发 出 “TLB 缺失 ”异常 , 调 出 专门 的 异常 处 理 程序 进行 处 理 。 对 
于 cache 缺失 , 则 通常 采用 硬件 处 理 方 式 。CPU 中 必须 提供 cache 缺失 处 理 逻 辑 , 当 CPU 
检测 到 cache 缺失 时 ,由 硬件 自动 启动 存储 器 读 操 作 , 读 取 一 个 “ 主 存 块 ?到 cache 中 。 
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7.1 教学 目标 和 内 容 安排 


主要 教学 目标 : 

使 学 生 深刻 理解 现代 计算 机 的 CPU 是 如 何 执行 指令 的 ,包括 指令 流水 线 基 本 原理 、 流 
水 段 寄 存 器 的 概念 、 流 水 线 数据 通路 的 设计 、 流 水 线 的 控制 信号 、 结 构 冒 险 及 其 处 理 、 数 据 冒 
险 及 其 处 理 、 转 发 技术 、 控 制 置 险 及 其 处 理 、 分 支 预 测 原理 \ 超 标量 和 动态 流水 线 的 概念 ;并 
让 学 生 初 步 了 解 在 指令 流水 线 中 如 何 处 理 异常 和 中 断 , 以 及 各 种 存储 器 访问 缺失 对 指令 流 
水 线 的 影响 。 

基本 学 习 要 求 : 

(1) 理解 指令 流水 线 的 一 般 概念 。 

(2) 了 解 适合 流水 线 执行 的 指令 集 特 征 。 

(3) 掌 拍 流 水 线 数据 通路 的 设计 方法 。 

(4) 了 解 流水 线 控制 器 的 设计 原理 。 

(5) 理解 流水 线 冒 险 的 基本 概念 。 

(6) 了 解 结构 冒险 的 概念 和 处 理 策略 。 

(7) 了 解数 据 冒 险 (数据 相关 ) 的 概念 。 

(8) 了 解 运用 转发 技术 解决 数据 冒险 的 基本 原理 。 

(9) 了 解 “Load-use” 数 据 冒 险 的 概念 和 处 理 策略 。 

(10) 了 解 控制 冒险 的 概念 和 引起 控制 冒险 的 几 种 原因 。 

(11) 了 解 静态 分 支 预测 和 动态 分 支 预 测 的 基本 原理 。 

(12) 了 解 异 常 和 中 断 对 流水 线 的 影响 。 

(13) 了 解 访 存 缺失 对 流水 线 的 影响 。 

(14) 了 解 超 流水 线 、 超 标量 和 动态 流水 线 等 高 级 流水 线 的 基本 概念 及 其 基本 实现 
技术 。 

现代 计算 机 都 采用 流水 线 方式 执行 指令 ,因此 ,有 关 指 令 的 流水 线 执行 方式 和 流水 线 处 理 
器 的 实现 等 内 容 是 非常 重要 的 。 主 教材 ?依照 “最早 的 简单 累加 器 型 CPU 一 总 线 式 CPU 一 单 
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周期 CPU-~ 多 周期 CPU-~ 基 本 流水 线 CPU-~ 动 态 超标 量 超 流水 线 CPU” 的 次 序 ,循序 渐 
进 地 介绍 了 CPU 设计 技术 及 其 发 展 过 程 。 实 际 上 前 面 介绍 的 总 线 式 CPU、 单 周期 CPU 和 
多 周期 CPU 等 非 流水 线 CPU 设计 的 内 容 都 是 为 后 面 介绍 流水 线 CPU 设计 做 铺垫 的 , 因 
为 ,真正 需要 学 生 掌 握 的 应 该 是 反映 现实 的 流水 线 处 理 器 的 实现 技术 。 

主教 材 主要 从 流水 线 概述 、 流 水 线 处 理 器 的 实现 、 流 水 线 冒 险 及 其 处 理 和 高 级 流水 线 技 
术 4 个 方面 对 流水 线 技术 进行 了 介绍 。 

对 于 流水 线 概述 部 分 ,因为 其 内 容 比较 简单 ,所 以 ,只 要 通过 对 一 个 简单 例子 的 讲解 ,让 
学 生 明 白 采用 流水 线 方式 执行 指令 的 基本 思想 ,以 及 采用 流水 线 后 指令 的 吞吐 率 与 指令 执 
行 时 间 的 变化 。 

对 于 流水 线 处 理 器 的 实现 ,以 具有 代表 性 的 11 条 MIPS 指令 为 实现 目标 ,分 析 每 条 指 
令 的 功能 和 执行 过 程 , 找 出 最 复杂 指令 所 需要 的 执行 阶段 。 在 介绍 流水 线 数据 通路 设计 时 ， 
可 以 对 照 前 面 的 单 周期 数据 道路 设计 思路 ,对 两 者 进行 比较 ,以 使 学 生 有 一 个 从 简单 到 复杂 
的 认识 过 程 , 有 利于 学 生 对 流水 线 设 计 和 实现 的 基本 方法 的 掌握 。 在 课时 有 限 的 情况 下 ,可 
以 只 选择 对 部 分 指令 在 流水 线 中 的 执行 过 程 进 行 讲 述 。 对 于 流水 线 CPU 中 控制 器 的 设 
计 , 只 要 把 控制 信号 在 流水 段 寄存 器 中 的 传送 过 程 说 明 清楚 ,再 说 明 流水 线 CPU 中 控制 器 
设计 方式 与 单 周期 CPU 中 控制 器 设计 方式 是 一 样 的 就 可 以 了 。 

对 于 流水 线 骨 险 及 其 处 理 , 可 以 通过 具体 指令 序列 在 流水 线 数 据 通 路 中 的 执行 过 程 来 
讲解 结构 冒险 、 数 据 冒 险 和 控制 骨 险 3 种 基本 流水 线 冒 险 的 含义 和 相应 的 骨 险 处 理 原理 ( 例 
如 ,加 nop 指令 、 转 发 .阻塞 .分 支 预测 等 )。 课 时 有 限 的 情况 下 ,对 于 一 些 具体 的 实现 细节 
可 以 跳 过 ,如 具体 的 转发 线路 \ 带 转发 控制 的 流水 线 数据 通路 、Load-use 数据 冒险 的 检测 和 
处 理 、 分 支 预测 的 具体 实现 .异常 或 中 断 引起 的 控制 骨 险 的 具体 处 理 ` 访 问 缺 失 引 起 的 流水 
线 阻塞 处 理 等 。 虽 然 ,上 述 内 容 的 具体 实现 在 课时 不 够 时 可 以 不 讲 ,但 是 ,对 于 这 些 内容 所 
涉及 的 基本 概念 和 基本 原理 ,学 生还 是 应 该 有 一 定 程 度 的 了 解 , 因 为 这 些 内 容 对 学 生 全 面 了 
解 指令 执行 过 程 中 数据 的 流动 过 程 , 以 及 全 面 掌 握 现代 计算 机 处 理 器 设计 技术 是 必需 的 。 

对 于 高 级 流水 线 技术 ,基本 要 求 是 能 够 了 解 超 流水 线 、 超 标量 和 动态 流水 线 等 高 级 流水 
线 的 基本 概念 及 其 基本 实现 技术 。 在 课时 有 限 的 情况 下 ,课堂 中 只 要 简单 说 明 每 种 实现 技 
术 的 基本 思想 即 可 ,具体 的 实现 实例 和 详细 的 描述 部 分 可 以 跳 过 。 


7.2 主要 内 容 提要 


1. 指令 流水 线 的 设计 和 实现 

指令 流水 线 设计 的 基本 思想 是 ,将 每 条 指令 的 执行 规整 化 为 同样 的 几 个 流水 阶段 ,并 规 
定 每 个 流水 阶段 的 执行 时 间 一 样 ,都 等 于 一 个 时 钟 周期 。 采 用 流水 线 方式 执行 指令 ,其 吞吐 
率 比 非 流水 线 方式 下 提高 了 若干 倍 , 但 是 ,对 于 每 一 条 指令 来 说 ,反而 比 非 流 水 线 方式 时 延 
长 了 执行 时 间 。 

每 个 流水 段 中 的 部 件 都 是 一 组 组 合 逻 辑 加 上 一 组 寄存 器 ,组 合 逻 辑 中 产生 的 结果 在 时 
钟 到 来 时 被 存 到 寄存 器 (如 程序 计数 器 \ 条 件 码 寄存 器 流水 段 寄 存 器 ) 中 。 每 两 个 相 邻 流水 
段 之 间 的 流水 段 寄存 器 ,用 于 记录 所 有 在 后 面 阶段 要 用 到 的 各 种 信息 ,例如 ,指令 代码 、 参 加 
运算 的 操作 数 、 指 令 运算 结果 、 指 令 异 常 信息 、 寄 存 器 读 口 地 址 、 寄 存 器 写 口 地 址 、 存 储 单元 
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地 址 、 新 的 PC 值 等 。 指 令 译 码 得 到 的 控制 信号 也 通过 流水 段 寄存 器 传送 到 后 面 各 个 流水 
段 中。 

2， 指 令 流水 线 的 局 限 性 

在 理想 情况 下 ,每 个 时 钟 到 来 ,都 有 一 条 指令 进入 流水 线 , 也 有 一 条 指令 执行 结束 。 但 
是 ,很 多 因素 会 导致 指令 流水 线 的 情况 不 很 理想 。 首 先 ,并 不 是 每 条 指令 都 有 相同 多 个 流水 
段 ,也 不 是 每 个 流水 段 的 执行 都 需要 一 样 长 的 时 间 , 因 此 ,为 了 能 够 方便 地 控制 指令 流水 线 
的 执行 ,通常 以 最 复杂 指令 所 需 阶 段 数 来 确定 流水 段 个 数 , 并 以 最 复杂 阶段 所 需 时 间 为 基准 
来 设计 时 钟 周 期 ;其 次 , 随 着 流水 线 深度 的 增加 ,流水 段 寄 存 器 的 读 写 所 带 来 的 额外 开销 比 
例 也 增 大 ;最 后 ,指令 执行 时 ,还 会 发 生 资源 冲突 、 数 据 相 关 、 控 制 相关 、cache 缺失 等 问题 ， 
导致 流水 线 被 阻塞 而 延长 程序 执行 时 间 。 

3. 流水 线 数据 通路 设计 举例 

以 下 以 MIPS 处 理 器 为 例 , 概 要 说 明 流水 线 数 据 通路 的 实现 原理 。 与 第 6 章 中 单 周期 
数据 通路 和 多 周期 数据 通路 的 实现 目标 一 样 ,流水 线 数据 通路 的 实现 目标 也 是 表 6. 1 所 示 
的 11 条 MIPS 指令 。 根据 对 11 条 指令 的 分 析 , 可 以 得 到 执行 这 11 条 指令 的 五 段 流 水 线 数 
据 通 路 基本 框架 ,如 图 7.1 所 示 。 
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图 7.1 五 段 流水 线 数据 通路 基本 框架 


在 图 7.1 所 示 的 流水 线 数 据 通路 中 ,每 条 指令 的 执行 都 经 历 5 个 流水 段 : IF、ID、Ex、 
Mem 和 Wr, 每 个 流水 段 都 在 不 同 的 功能 部 件 中 执行 。 流 水 段 之 间 有 一 个 流水 段 寄 存 器 , 例 
如 ,IF/ID 寄存 器 是 介 于 IF 段 和 ID 段 之 间 的 寄存 器 。 每 个 流水 段 寄 存 器 用 来 存放 从 当前 
流水 自传 到 后 面 所 有 流水 段 的 信息 。 因 为 每 个 段 间 传 递 的 信息 不 一 样 ,所 以 各 流水 段 寄存 
器 的 长 度 也 不 一 样 。 
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图 7.1 中 的 取 指令 部 件 TUnit 和 执行 部 件 ExecUnit 分 别 如 图 7.2 和 7. 3 所 示 。 
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图 7.3 执行 部 件 ExecUnit 的 实现 


如 图 7.2 所 示 的 取 指令 部 件 中 ,IM 为 指令 存储 器 ,取出 的 指令 被 送 到 IF/ID 流水 段 寄 
存 器 的 输入 端 ,在 下 一 个 时 钟 到 来 后 开始 写 人 。 在 取 指 令 的 同时 ,计算 PC 十 4, 得 到 的 值 被 
送 到 PC 的 输入 端 ,在 下 一 个 时 钟 到 来 后 开始 写 人 PC。 

不 同 的 指令 在 不 同 的 控制 信号 控制 下 在 执行 部 件 中 执行 不 同 的 操作 。 

4. 流水 线 冒 险 的 检测 与 处 理 

指令 流水 线 中 ,可 能 会 遇 到 一 些 情况 使 得 流水 线 无 法 正确 执行 后 续 指 令 , 而 引起 流水 线 
阻塞 (停顿 ) 。 这 种 现象 称 为 流水 线 骨 险 。 根 据 导致 冒险 的 原因 的 不 同 , 分 为 结构 骨 险 、 数 据 
冒险 和 控制 冒险 3 种 。 

结构 冒险 也 称 资源 冲突 ,由 多 条 指令 同时 竟 用 同一 个 功能 部 件 引 起 。 所 用 的 解决 策略 
包括 : 规定 每 个 功能 部 件 在 一 条 指令 中 只 能 被 用 一 次 ; @ 规 定 每 个 功能 部 件 只 能 在 某 个 
特定 的 阶段 被 用 ; 图 将 指令 存储 器 (如 code cache) 和 数据 存储 器 (如 data cache) 分 开 。 
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数据 冒险 也 称 数据 相关 。 当 前 面 指令 的 执行 结果 是 后 面 指令 的 操作 数 时 ,可 能 会 发 生 
数据 冒险 。 所 用 解决 策略 有 软件 和 硬件 两 种 方式 。 中 软件 方式 : 编译 器 在 发 生 数 据 相 关 的 
指令 之 间 插 入 足够 的 nop 指令 ,这 种 方式 下 ,CPU 执行 程序 时 便 不 会 发 生 数据 冒险 现象 , 软 
件 方式 简化 了 硬件 实现 ,但 是 ,软件 方式 会 同时 增加 程序 的 空间 开销 和 时 间 开 销 ; @ 硬 件 方 
式 : 有 两 种 硬件 解决 方式 ,一 种 方式 是 单纯 采用 “阻塞 ”技术 , 另 一 种 方式 是 采用 "转发 十 阻 
塞 ” 技 术 。 在 上 述 图 7. 1 中 加 上 转发 检测 及 处 理 、Load-use 冒险 检测 及 处 理 机 制 后 ,就 可 以 
解决 数据 冒险 问题 。 采 用 “转发 十 阻塞 ”技术 的 部 分 流水 线 数据 通路 如 图 7.4 所 示 。 
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图 7.4 ， 带 转发 和 load-use 冒险 处 理 的 部 分 流水 线 数据 通路 


CPU 在 执行 程序 过 程 中 ,动态 检测 是 否 存 在 数据 相关 ,在 存在 数据 相关 的 情况 下 ,通过 
转发 ( 旁 路 ) 技 术 将 前 面 指令 执行 过 程 中 得 到 的 结果 直接 传送 到 后 面 指令 执行 时 需要 操作 数 
的 地 方 ,对 于 像 Load-use 这 样 不 能 通过 转发 解决 的 数据 骨 险 , 则 在 指令 的 特定 流水 段 插 人 
“气泡 ”以 “阻塞 ”指令 继续 执行 ,直到 后 面 指令 能 够 取得 所 需 数据 为 止 。 单 纯 采 用 硬件 “ 阻 
塞 ”的 方式 ,使 得 程序 的 空间 开销 比 软件 方式 好 ,但 时 间 开销 并 没有 减少 ,而 采用 "转发 十 阻 
塞 ” 的 方式 则 可 同时 减少 空间 开销 和 时 间 开 销 。 

控制 冒险 也 称 控制 相关 。 当 返回 指令 、 分 支 指令 、 跳 转 指 令 等 有 可 能 改变 顺序 增 量 的 
PC 值 时 ,由 于 获取 转移 目标 地 址 的 时 间 较 长 ,使 得 在 目标 地 址 产生 前 已 经 将 下 一 条 指令 取 
到 流水 线 中 ,如 果 已 经 取出 执行 的 指令 不 是 应 该 执行 的 指令 , 则 发 生 了 控制 冒险 。 所 用 解决 
策略 也 分 为 软件 方式 和 硬件 方式 。@ 软 件 方式 。 有 两 种 软件 方式 ,一 种 方式 是 编译 器 简单 
地 在 分 支 指 令 、 跳 转 指令 等 引起 控制 相关 的 指令 后 面 播 人 足够 的 nop 指令 ; 另 一 种 方式 是 
分 支 延 迟 调 度 技术 ,编译 器 将 前 面 若干 条 与 分 支 指令 等 无 关 的 指令 调 到 后 面 填充 到 延迟 醒 
中 ,不够 填 满 延迟 槽 时 ,用 nop 指令 补足 。 不 同 指令 的 延迟 槽 (延迟 损失 时 间 片 ) 不 同 , 它 与 
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该 指令 能 在 几 个 周期 内 得 到 正确 的 PC 值 有 关 。 在 软件 进行 了 这 些 处 理 后 ,流水 线 执行 时 
就 不 会 发 生 控 制 骨 险 现象 。@ 硬 件 方式 。 在 分 支 指令 、 跳 转 指令 等 引起 控制 相关 的 指令 后 
面 插入 “气泡 ”, 使 流水 线 停顿 若干 时 钟 ,直到 得 到 正确 的 PC 值 为 止 。 

对 于 分 支 指令 引起 的 控制 冒险 ,车 用 硬件 方式 处 理 , 则 通常 在 上 述 硬件 处 理 的 基础 上 ， 
还 会 采用 “分 支 预测 技术。 有 静态 预测 和 动态 预测 两 种 技术 ,静态 预测 与 分 支 指令 执行 的 
历史 情况 无 关 , 可 以 预测 总 是 条 件 满足 (Taken) 而 转移 ,也 可 以 预测 总 是 条 件 不 满足 (Not 
Taken) 而 顺序 执行 ;动态 预测 利用 分 支 指令 执行 的 历史 情况 来 进行 预测 ,并 根据 实际 执行 
情况 动态 调整 。 可 采用 一 位 预测 、 两 位 预测 ,甚至 三 位 预测 技术 ,动态 预测 能 达到 90% 的 成 
功率 。 不 管 采用 哪 种 分 支 预测 技术 ,只 要 预测 失败 ,都 必须 将 错误 执行 的 指令 从 流水 线 中 冲 
刷 掉 。 

除了 上 述 几 种 流水 线 骨 险 之 外 ,异常 和 中 断 的 发 生 、cache 缺失 、TLB 缺失 等 也 都 会 引 
起 流水 线 阻塞 。 对 于 异常 和 中 断 引起 的 骨 险 ,其 处 理 方式 与 分 支 预测 错误 时 的 处 理 类 似 。 
对 于 cache 缺失 引起 的 骨 险 , 则 无 须 冲 刷 指令 ,只 要 冻结 机 器 状态 若干 个 时 钟 周期 即 可 。 对 
于 TLB 缺失 , 则 可 以 像 缺 页 一 样 作为 一 种 内 部 异常 来 处 理 , 也 可 以 像 cache 缺失 一 样 完全 
由 硬件 处 理 。 

5， 高 级 流水 线 技术 

高 级 流水 线 技术 充分 利用 指令 级 并 行 来 提高 流水 线 执行 的 性 能 。 有 两 种 增加 指令 级 并 行 
的 策略 。 一 种 是 超 流水 线 技术 , 它 通 过 增加 流水 线 的 级 数 来 使 更 多 的 指令 同时 在 流水 线 中 重 
三 执行 ; 另 一 种 是 多 发 射流 水 线 技术 ,通过 同时 启动 多 条 指令 独立 运行 来 提高 指令 并 行 性 。 

采用 多 发 射 技术 的 处 理 器 称 为 超标 量 处 理 器 。 要 实现 多 发 射流 水 线 必 须 完 成 对 指令 进 
行 打包 和 凡 险 处 理 两 个 任务 ,指令 打包 是 指 将 能 并 行 处 理 的 多 条 指令 同时 发 射 到 发 射 槽 中 。 
根据 指令 打包 任务 是 由 编译 器 静态 完成 还 是 由 处 理 器 动态 完成 ,可 将 多 发 射 技术 分 为 静态 
多 发 射 和 动态 多 发 射 两 类 。 

静态 多 发 射 处 理 器 通过 编译 器 静态 推测 来 完成 指令 打包 和 冒险 处 理 任务 ,指令 打包 的 
结果 可 看 成 将 同时 发 射 的 多 条 指令 合并 到 一 个 长 指令 中 , 因此 , 也 称 为 超 长 指令 字 
(CVLIW) 。 动 态 多 发 射 处 理 器 在 指令 执行 时 由 处 理 器 硬件 进行 动态 流水 线 调 度 来 完成 指令 
打包 和 冒险 处 理 任务 , 即 处 理 器 可 以 动态 地 将 后 面 的 一 些 无 关 指令 调 到 前 面 先 执行 。 动 态 
流水 线 调度 可 以 实现 “ 按 序 发 射 , 按 序 完成 “ 按 序 发 射 , 无 序 完 成 "和 “无 序 发 射 ,无 序 完 成 ” 
指令 执行 模式 。 


7.3 ”基本 术语 解释 


指令 流水 线 (Instruction Pipelining) 

多 条 指令 重合 执行 的 一 种 指令 执行 方式 。 流水线 方 式 下 ,一 条 指令 的 执行 过 程 被 分 成 
若干 个 操作 子 过 程 (也 称 为 “流水 段 ”) ,每 个 子 过 程 由 一 个 独立 的 功能 部 件 来 完成 。 在 同一 
条 流水 线 中 ,每 条 指令 所 包含 的 操作 子 过 程 个 数 必须 一 样 ,每 个 子 过 程 所 花 的 时 间 也 要 设计 
成 相同 的 。 因 此 ,一般 按 最 复杂 的 指令 来 设计 流水 段 个 数 ,以 最 复杂 的 子 过 程 来 设计 流水 段 
的 宽度 。 这 样 ,所 有 功能 部 件 可 以 同时 执行 不 同 指令 的 不 同 子 过 程 中 的 操作 , 即 第 i 十 1 条 
指令 的 第 上 段 和 第 i 条 指令 的 第 E 十 1 段 同 时 执行 。 理 想 情 况 下 ,经 过 若干 周期 后 ,流水 线 
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能 在 每 个 周期 内 执行 完 一 条 指令 。 

现代 计算 机 一 般 把 复杂 度 相 近 的 指令 用 同一 条 流水 线 完 成 ,而 把 复杂 度 相差 很 大 的 指 
令 安排 在 不 同 的 流水 线 中 。 

流水 线 深度 (Pipeline Depth) 

流水 段 的 个 数 称 为 流水 线 深 度 或 流水 线 级 数 。 

指令 吞吐 量 (Instruction Throughput) 

单位 时 间 内 处 理 器 执行 指令 的 条 数 。 采 用 流水 线 指令 执行 方式 能 提高 指令 的 吞吐 率 ， 
但 不 能 缩短 每 条 指令 的 执行 时 间 。 

流水 段 寄 存 器 (Pipeline Register) 

每 两 个 相 邻 的 流水 段 之 间 需 要 设置 一 个 流水 段 寄存 器 ,用 来 存放 前 一 个 流水 段 中 产生 
的 并 需 传输 到 其 后 所 有 流水 段 的 信息 ,包括 各 种 数据 (PC、 指 令 、 立 即 数 、 运 算 结 果 、 寄 存 器 
号 等 ) 和 控制 信号 两 大 类 信息 。 每 个 流水 段 的 功能 不 一 样 ,所 需 传递 的 信息 也 不 同 ,各 流水 
段 寄 存 器 的 长 度 也 因此 而 不 同 。 

流水 线 冒 险 (Hazard) 

当 若 干 指令 都 已 进入 流水 线 开始 执行 后 ,如 果 其 中 某 些 后 续 指令 的 某 些 流水 段 任务 不 
能 按时 开始 执行 ( 若 执 行 就 会 发 生 错误 ) , 则 说 明 流 水 线 被 破坏 ,这 种 现象 称 为 流水 线 冒 险 。 
有 3 种 流水 线 冒 险 : 结构 冒险 、 控 制 冒 险 、 数 据 冒 险 。 

结构 冒险 (Structural Hazard) 

在 指令 流水 线 中 ,同一 个 部 件 同 时 需 被 不 同 指令 所 使 用 的 现象 称 为 结构 冒险 ,也 称 为 资 
源 冲突 (Resource Conflicts) 。 

控制 冒险 (Control Hazard) 

在 指令 流水 线 中 ,转移 指令 或 异常 等 情况 改变 了 程序 执行 的 流程 ,而 使 得 在 目标 地 址 产 
生前 已 被 取 到 流水 线 中 的 指令 无 效 的 现象 称 为 控制 冒险 ,也 称 为 控制 相关 (Control 
Dependency)。 分 支 指令 引起 的 控制 冒险 称 为 分 支 冒险 (Branch Hazard) 。 

数据 冒险 (Data Hazard) 

在 指令 流水 线 中 ,后 面 指令 需要 用 到 前 面 指 令 的 结果 时 ,前 面 指令 的 结果 还 没 产生 的 现 
象 称 为 数据 冒险 ,也 称 为 数据 相关 (Data Dependency) 。 

流水 线 阻塞 (Pipeline Stall)/ 气 泡 (Bubble) 

流水 线 中 下 一 条 指令 不 能 执行 时 ,就 在 硬件 上 加 入 额外 的 电路 来 使 得 下 一 条 指令 延迟 
若干 周期 再 执行 ,这 种 方式 称 为 流水 线 阻塞 或 流水 线 停顿 。 有 时 也 会 形象 地 称 这 种 做 法 为 
在 流水 线 中 插 人 气泡 (Bubble) 。 

空 操作 (Nop) 

空 操作 就 是 不 做 任何 动作 ,而 只 是 在 时 间 上 延迟 一 段 时 间 。 有 两 种 情况 : (1) 为 了 规整 
流水 线 ,在 某 些 指 令 的 执行 过 程 中 加 和 人 空 流水 段 ,这 种 空 流 水 段 中 的 操作 称 为 空 操作 ;(2) 为 
了 避免 流水 线 冒 险 , 在 相关 指令 的 前 后 加 入 nop 指令 ,使 得 流水 线 停顿 若干 时 钟 ,等 到 需要 
的 信息 得 到 后 再 继续 执行 后 面 的 指令 。 

转发 (Forwarding) 

当 后 面 指令 要 用 到 前 面 指令 的 结果 数据 时 ,前 面 流 水 段 部 件 中 得 到 的 数据 直接 通过 连 
线 传送 到 后 面 流水 段 的 部 件 中 ,而 不 等 待 前 面 指令 的 结束 。 这 种 方式 称 为 转发 或 旁 路 , 它 能 
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解决 部 分 数据 骨 险 。 

旁 路 (Bypassing) 

是 数据 转发 技术 的 别称 。 

分 支 条 件 满足 (Branch Taken) /分支 条 件 不 满足 (Branch Not Taken) 

对 于 条 件 转移 指令 (分 支 指令 Branch) ,其 执行 结果 总 有 两 种 可 能 性 : 一 种 是 条 件 满足 
( 称 为 “Branch Taken”) ,此 时 转 到 转移 目的 地 址 处 继续 执行 ; 另 一 种 是 条 件 不 满足 ( 称 为 
“Branch Not Taken”) ,此 时 则 继续 取 下 一 条 指令 执行 。 

分 支 预测 (Branch Predict) 

在 流水 线 执行 过 程 中 ,对 每 条 分 支 指令 进行 预测 ,可 以 简单 地 预测 “Branch Taken” 或 
“Branch Not Taken”, 也 可 以 根据 历史 情况 动态 预测 。 流 水 线 执行 时 ,总 是 把 预测 发 生 的 分 
支 处 下 一 条 指令 取 到 流水 线 中 。 这 样 ,只 要 预测 成 功 ,流水 线 就 不 会 发 生 阻 塞 。 如 果 预 测 不 
成 功 , 则 流水 线 要 退回 到 正确 的 分 支 地 址 处 重新 启动 流水 线 执行 ,原先 不 该 取出 执行 的 指令 
要 排除 出 流水 线 , 称 为 清洗 或 冲刷 (Flush) 流 水 线 。 

分 支 延迟 (Delayed Branch) 

分 支 延 迟 调度 方法 采用 编译 优化 方法 调整 指令 执行 顺序 ,将 分 支 指 令 前 面 的 、 与 分 支 指 
令 无 关 的 指令 放 到 分 支 指令 后 面 执行 ,以 填充 延迟 损失 时 间 片 (分 支 延 迟 模 ), 不 够 时 再 用 
nop 操作 填充 ,这 样 ,使 得 分 支 指令 能 在 足够 长 的 时 间 内 得 到 跳 转 地 址 计算 结果 ,从 而 避免 
流水 线 的 阻塞 。 

分 支 延迟 损失 时 间 片 (Penalty for Branch Delay) 

由 于 分 支 指令 引起 流水 线 阻塞 而 带 来 的 延迟 执行 时 钟 周期 数 ,也 称 为 分 支 延迟 时 间 片 。 

分 支 延 迟 槽 (Branch Delay Slot) 

分 支 延 迟 调 度 方法 中 ,分 支 指令 后 面 被 填 的 指令 位 置 称 为 “分 支 延 迟 槽 >”。 需 要 填 人 的 
指令 条 数 ( 分 支 延迟 槽 数 ) 等 于 分 支 延 迟 损失 时 间 片 。 

指令 级 并 行 (Instruction Level Parallelism,ILP) 

在 CPU 执行 程序 时 ,通过 多 条 指令 之 间 的 并 行 执行 来 提高 处 理 器 性 能 的 一 种 技术 。 

IPC(Instruction per Clock) 

每 个 时 钟 周 期 内 可 以 执行 完成 的 指令 条 数 , 是 CPI 的 倒数 。 

超 流水 线 (Superpipelining) 

是 指 具有 更 多 级 流水 段 的 一 种 流水 线 。 在 理想 情况 下 ,流水 线 阶段 越 多 , 则 指令 的 吞吐 
率 越 高 ,所 以 一 些 处 理 器 采用 8 个 或 更 多 流水 阶段 , 称 为 超 流水 线 。 

超 长 指令 字 (Very Long Instruction Word, VLIW) 

通过 编译 器 静态 推测 来 辅助 完成 指令 打包 和 冒险 处 理 时 ,通常 将 一 个 周期 内 发 射 的 多 
个 指令 预先 组 织 为 一 条 具有 多 个 操作 的 长 指令 ,这 种 将 多 条 指令 打包 生成 的 指令 称 为 超 长 
指令 字 , 执 行 这 种 超 长 指令 字 的 处 理 器 称 为 VLIW 处 理 器 。 

超标 量 流水 线 (Superscalar Pipelining) 

若干 条 指令 (如 整数 运算 、 浮 点 运算 、 装 人 /存储 等 ) 被 同时 启动 并 独立 进入 流水 线 执行 ， 
即 每 个 时 钟 周期 发 射 多 条 指令 。 为 此 ,需要 有 多 套 取 指 部 件 和 指令 译 码 部 件 , 并 且 同 时 有 多 
条 指令 执行 ,所 以 应 有 多 个 执行 部 件 。 如 定点 处 理 部 件 、 浮 点 处 理 部 件 、 乘 /除法 部 件 、 取 数 / 
存 数 部 件 等 。 超 标量 流水 线 采用 的 是 一 种 多 指令 发 射 (Multiple-instruction issue) 方 式 。 


毕 令 流 冰 线 


动态 流水 线 (Dynamic Pipelining) 

动态 流水 线 通 过 指令 相关 性 检测 和 动态 分 支 预 测 等 手段 ,投机 性 地 不 按 指令 顺序 执行 ， 
当 发 生 流 水 线 阻塞 时 ,可 以 到 后 面 找 指令 来 执行 。 动 态 流水 线 的 通用 模型 由 以 下 主要 单元 
组 成 : 指令 预 取 和 分 发 单元 、 执 行 单元 、 提 交 单 元 。 这 种 调整 指令 执行 顺序 的 方式 称 为 动态 
流水 线 调度 (Dynamic Pipeline Scheduling) 。 

指令 预 取 (Instruction Prefetch) 

在 指令 执行 前 ,预先 把 指令 取 到 CPU 的 指令 缓冲 器 中 。 这 样 ,在 指令 执行 时 ,不 需 
要 再 去 取 指 令 , 可 以 很 快 地 直接 执行 指令 。 流 水 线 指 令 执行 方式 中 通常 采用 指令 
预 取 。 

指令 分 发 (Instruction Dispatch) 

对 指令 队列 中 的 指令 进行 译 码 ,根据 译 码 结果 将 指令 分 派 到 相应 的 执行 单元 。 
行 指令 译 码 和 分 发 的 部 件 称 为 分 发 单元 。 

静态 多 发 射 (Static Multiple Issue) 

通过 编译 器 静态 推测 来 辅助 完成 指令 打包 和 冒险 处 理 。 通 常 将 一 个 周期 内 同时 发 射 的 
多 个 指令 预先 组 织 为 一 条 多 个 操作 的 长 指令 , 称 为 一 个 “发 射 包 >。 静态 多 发 射 处 理 器 主要 
考虑 处 理 数据 冒险 和 控制 冒险 。 

动态 多 发 射 (Dynamic Multiple Issue) 

通过 在 指令 执行 过 程 中 由 处 理 器 硬件 动态 完成 流水 线 调 度 来 完成 指令 打包 和 冒险 处 
理 。 目 前 的 超标 量 处 理 器 大 多 采用 动态 多 发 射流 水 线 。 

按 序 发 射 (In-order Issue) 

按照 程序 中 原来 的 指令 顺序 进行 指令 发 射 。 

无 序 发 射 (Out-of-order Issue) 

不 按 程序 中 原来 的 顺序 发 射 指令 ,把 可 能 发 生 冒 险 的 指令 推 后 发 射 , 而 把 后 面 无 冒险 的 
指令 提前 发 射 。 

指令 执行 单元 (Instruction Execute Unit) 

用 来 执行 指令 的 功能 部 件 。 在 动态 流水 线 中 ,不 同 的 指令 被 分 派 到 不 同 的 指令 执行 
元 中 。 如 整数 运算 单元 、 浮 点 运算 单元 、 存 数 单元 、 取 数 单元 等 。 

存储 站 (Reservation Station) 

在 动态 调度 流水 线 中 ,每 个 执行 单元 都 有 自己 的 缓存 ,用 来 保存 当前 执行 的 指令 、 操 作 
数 和 结果 等 。 这 个 缓存 称 为 存储 站 或 保留 站 。 

乱 序 执行 (Out-of-order Execution) 

动态 多 发 射流 水 线 中 ,在 指令 执行 单元 有 很 多 指令 同时 被 执行 ,而 且 每 种 指令 所 用 的 执 
行 时 间 也 不 一 样 , 所 以 ,无 法 按照 程序 中 原来 的 顺序 执行 指令 ,因此 ,动态 流水 线 中 ,指令 一 
定 是 乱 序 执行 的 。 

重 排序 缓冲 (Reorder Buffer) 

因为 指令 执行 是 无 序 的 ,所 以 ,需要 对 执行 后 的 指令 重新 排序 ,在 指令 最 后 提交 前 先 要 
将 其 存放 在 重 排序 缓存 中 。 

指令 提交 单元 (Instruction Commit Unit) 

将 指令 执行 的 结果 写 到 结果 寄存 器 或 存储 单元 中 以 完成 指令 最 后 一 步 操作 称 为 结果 提 
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交 。 提 交 单 元 在 重 排序 缓冲 中 保存 所 有 挂 起 的 指令 ,根据 分 支 功 能 单元 执行 的 结果 确定 预 
测 是 否 成 功 ,从 而 确定 哪些 指令 需 从 重 排序 缓冲 中 清除 ,哪些 指令 可 以 提交 结果 。 
按 序 完成 (In-order Completion》 
按照 程序 中 原来 的 指令 顺序 完成 指令 的 执行 。 
无 序 完成 (Out-of-order Completion) 
不 按照 程序 中 原来 的 指令 顺序 完成 指令 的 执行 。 
按 序 发 射 按 序 完成 
按照 程序 中 原来 的 指令 顺序 预 取 、 译 码 和 分 发 ,也 按 原来 的 指令 顺序 完成 指令 的 执行 。 
按 序 发 射 无 序 完 成 
按照 程序 中 原来 的 指令 顺序 预 取 、 译 码 和 分 发 ,但 不 按 原来 的 指令 顺序 完成 指令 的 执行 。 
无 序 发 射 无 序 完 成 
不 按照 程序 中 原来 的 指令 顺序 预 取 、 译 码 和 分 发 ,也 不 按 原来 的 指令 顺序 完成 指令 的 


执行 。 
写 后 读 (RAW) 相 关 
若 前 一 条 指令 写 人 某 寄存 器 ,后 一 条 指令 需要 从 该 寄存 器 读 出 , 则 称 这 两 条 指令 是 写 后 
读 相关 的 。 

写 后 写 (WAW) 相 关 

若 前 一 条 指令 和 后 一 条 指令 都 需要 对 同一 个 寄存 器 进行 写 人 , 则 称 这 两 条 指令 是 写 后 
写 相 关 的 。 这 种 相关 性 ,在 无 序 发 射 或 乱 序 执行 时 可 能 会 发 生 数 据 冒 险 , 而 在 按 序 发 射 并 按 
序 完成 时 ,不 会 发 生 数据 冒险 。 


7.4 常见 问题 解答 


1， 什 么 样 的 指令 格式 更 适合 流水 线 方式 ? 

答 : 定 长 指令 字 和 定 长 操作 码 使 得 每 条 指令 的 预 取 和 译 码 操作 一 致 ,便于 流水 线 控制 
指令 类 型 少 、 操 作 数 地 址 规整 便于 规划 取 操 作 数 步骤 ,并 使 得 对 指令 进行 译 码 的 同时 ,可 以 
读 取 寄 存 器 操作 数 : 采 用 Load/Store 型 指令 风格 便于 利用 执行 运算 步骤 来 进行 地 址 计算 。 
由 此 可 知 ,RISC 指令 设计 风格 更 适合 流水 线 方式 。 

2. 采用 流水 线 方式 能 使 一 条 指令 的 执行 时 间 更 短 吗 ? 

答 : 不 能 。 采 用 流水 线 方式 使 得 指令 吞吐 率 提高 了 , 即 在 给 定 的 时 间 内 完成 指令 执行 
的 条 数 增加 了 ,但 每 条 指令 的 执行 过 程 没有 减少 ,所 以 不 会 缩短 一 条 指令 的 执行 时 间 , 反 而 
会 延长 一 条 指令 的 执行 时 间 。 

3. 为 什么 流水 线 方式 会 延长 一 条 指令 的 执行 时 间 ? 

答 : 因为 在 确定 一 条 流水 线 的 流水 段 个 数 时 ,是 以 最 复杂 指令 执行 过 程 所 需要 的 流水 
段 个 数 为 标准 设计 的 ;在 确定 每 个 流水 段 的 宽度 时 ,也 以 最 复杂 流水 段 所 需要 的 宽度 来 设 
计 。 因 而 ,所 有 指令 都 需要 花费 最 慢 指 令 所 需要 的 执行 时 间 才 能 完成 执行 。 此 外 ,每 个 流水 
段 之 间 要 有 信息 的 缓存 和 传递 等 ,这 也 增加 了 人 额外 的 执行 时 间 开 销 。 

4. 二 阶段 流水 线 能 成 倍 提高 指令 执行 效率 吗 ? 

答 : 不 能 。 二 阶段 流水 线 把 一 个 指令 周期 分 成 取 指令 和 执行 指令 两 个 阶段 ,是 最 简单 
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的 流水 线 , 它 不 能 成 倍 提高 指令 执行 效率 。 这 有 很 多 原因 ,主要 有 :(1) 因 为 每 条 指令 的 执 
行 阶段 所 花 时 间 不 同 ,流水 线 要 求 以 最 慢 指令 为 标准 来 设计 ,所 以 ,执行 阶段 时 间 可 能 会 很 
长 。(2) 虽 然 每 条 指令 的 取 指 令 过 程 可 能 一 样 ,但 是 流水 线 中 要 求 每 个 流水 段 的 时 间 相 同 ， 
所 以 , 取 指 令 阶 段 时 间 也 要 和 最 慢 指令 的 执行 时 间 一 样 。(3) 流 水 段 寄 存 器 会 增加 一 定 的 延 
迟 。(4) 各 种 流水 线 冒 险 会 破坏 流水 线 , 造 成 流水 线 的 停顿 ,影响 指令 执行 效率 。 

S. 加 们 流水 线 的 阶段 数 能 成 倍 提高 指令 执行 效率 吗 ? 

答 : 不 能 。 一般 来 说 ,加 倍 流 水 线 的 阶段 数 会 提高 指令 的 执行 效率 ,但 是 不 能 成 倍 提 
高 。 主 要 原因 是 因为 增加 流水 段 ,使 得 流水 段 之 间 的 流水 段 寄 存 器 的 读 写 开销 增加 了 。 例 
如 ,假定 一 个 三 阶段 流水 线 的 每 一 级 流水 段 中 组 合 逻辑 延 时 为 100ps, 流 水 段 寄存 器 延 时 为 
20ps, 则 时 钟 周期 至 少 为 100 十 20 王 120ps, 吞 时 率 为 1/120ps 二 8. 33GOPS (每 秒 千 兆 次 操 
作 ) ,指令 延 时 至 少 为 3X120 一 360ps; 如 果 流 水 段 数 成 倍增 加 到 六 段 , 则 每 个 流水 段 的 组 合 
逻辑 延 时 变 为 50ps, 故 时 钟 周期 变 为 50 十 20 王 70ps, 吞 性 率 为 1/70ps 二 14. 29GOPS ,指令 
延 时 为 6X70 二 420ps。 所 以 ,性 能 只 提高 到 大 约 14. 29/8. 33 二 1. 71 倍 , 而 不 是 2 倍 ,指令 延 
时 增加 了 420 一 360 二 60ps, 这 主要 是 流水 段 寄 存 器 增加 的 延 时 。 

6. 流水 线 深 度 越 深 , 时 钟 频率 就 越 高 ,对 吗 ? 

答 : 一 般 来 说 ,在 指令 执行 时 间 一 定 的 情况 下 ,流水 线 深度 越 深 ,时 钟 频率 就 越 高 。 增 
加 流水 段 个 数 ,使 得 每 个 流水 段 内 的 操作 变 得 非常 简单 ,因而 ,每 个 阶段 的 延 时 就 很 小 ,也 就 
缩短 了 时 钟 周期 ,提高 了 时 钟 频 率 。 但 是 ,流水 线 深度 不 能 无 限制 提高 , 随 着 流水 段 个 数 的 
增加 ,流水 段 之 间 的 流水 段 寄存 器 增多 ,加 大 了 流水 段 之 间 缓 冲 的 额外 开销 , 当 额 外 开销 的 
比例 达到 50% 时 ,再 增加 流水 线 的 深度 就 没有 意义 了 。 此 外 ,用 于 流水 线 优化 和 存储 器 (或 
寄存 器 ) 冲 突 处 理 的 控制 逻辑 将 随 流 水 线 深度 的 加 深 而 大 量 增多 ,可 能 导致 用 于 流水 段 之 间 
的 控制 逻辑 比 流水 段 本 身 的 控制 逻辑 更 复杂 。 

7. 流水 线 方式 下 ,如 何 确定 流水 段 的 个 数 ? 

答 : 流水 线 方式 下 ,一 条 指令 的 执行 过 程 被 分 成 了 若干 个 操作 子 过 程 。 由 于 每 条 指令 
所 完成 的 功能 不 同 , 所 包含 的 操作 过 程 就 不 同 。 有 的 指令 完成 寄存 器 之 间 的 传送 :有 的 是 简 
单 的 加 / 减 运算 ;还 有 的 是 复杂 的 乘 / 除 运算 。 这 些 操 作 所 花 的 时 间 相 差 很 大 ,因此 ,这 些 指 
令 如 果 都 在 同一 个 流水 线 中 执行 ,就 必须 按 最 复杂 的 指令 来 设计 流水 线 的 流水 段 个 数 。 现 
代 计 算 机 一 般 把 复杂 度 相 近 的 指令 用 同一 条 流水 线 完成 ,而 把 复杂 度 相差 很 大 的 指令 安排 
在 不 同 的 流水 线 中 。 

8. 流水 线 方式 执行 指令 时 ,总 能 在 一 个 时 钟 内 完成 一 条 指令 的 执行 吗 ? 

答 : 不 能 。 理 想 情况 下 ,经 过 若干 周期 后 ,能 在 每 个 周期 内 完成 一 条 指令 , 即 CPI 一 1。 
但 是 , 当 程 序 中 出 现 以 下 情况 时 ,流水 线 被 破坏 ,因而 ,不 能 达到 CPI 二 1。(1) 当 有 多 条 指令 
的 不 同 阶段 都 要 用 到 同一 个 功能 部 件 时 ,发 生 资源 冲突 ,后 面 指令 要 延 时 执行 ;2) 当 程序 
的 执行 流程 发 生 改 变 时 ,发 生 控 制 相关 ,原来 按 顺 序 取出 的 指令 无 效 ;(3) 当 后 面 指令 的 操 
作 数 是 前 面 指令 的 运行 结果 时 ,发 生 数 据 相 关 , 后 面 指令 要 延 时 执行 。 此 外 ,还 有 cache 缺 
失 、TLB 缺失 .异常 和 中 断 等 的 发 生 都 会 阻塞 流水 线 的 执行 。 

9. 如何 解决 结构 冒险 ? 

答 : 通过 以 下 两 种 规整 流水 线 结构 的 方式 可 以 解决 部 分 结构 冒险 。(1) 规 定 每 个 功能 
部 件 在 每 条 指令 执行 过 程 中 只 能 被 使 用 一 次 ,例如 ,每 条 指令 只 能 用 一 次 “寄存 器 写 口 ”; 
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(2) 每 个 功能 部 件 只 能 在 一 个 特定 的 流水 段 内 被 使 用 ,例如 “寄存 器 写 口 ”只 能 在 第 5 个 流 
水 阶段 被 使 用 。 

另外 ,指令 和 数据 分 别 存放 在 不 同 的 存储 器 中 ,使 得 同时 访问 指令 和 数据 不 会 引起 存储 
器 资源 的 结构 冒险 。 这 在 大 多 数 处 理 器 中 都 是 这 样 的 ,因为 在 Ll cache 的 data cache 和 
code cache 是 分 开 的 。 

10. 什么 是 控制 冒险 ? 哪些 情况 下 会 发 生 控 制 冒 险 ? 

答 : 正常 情况 下 PC 的 值 按 顺序 增 量 ,但 在 执行 转移 类 指令 或 发 生 异 常 和 中 断 时 ,PC 的 
值 由 指令 或 异常 /中 断 处 理 部 件 给 出 。 流 水 线 方式 下 ,如 果 在 取 下 一 条 指令 时 ,下 一 条 指令 
的 地 址 还 没有 送 到 PC 中 ,那么 所 取 的 下 一 条 指令 就 不 是 正确 的 ,因而 发 生 控 制 冒险 。 可 以 
看 出 ,如 果 确 定 下 一 条 指令 地 址 所 用 时 间 较 长 ,就 会 因为 来 不 及 在 一 个 时 钟 周期 内 得 到 正确 
的 PC 值 而 发 生 控 制 冒险。 通常 ,转移 类 指令 会 发 生 控 制 冒 险 ,例如 ,分 支 指令 (条 件 转移 指 
令 ) 要 根据 条 件 测试 结果 来 确定 PC 的 值 ,因而 会 发 生 控 制 冒险 ;返回 指令 需要 从 存储 器 中 
读 取 返回 地 址 送 PC ,因而 也 会 发 生 控 制 崩 险 。 

11. 无 条 件 转移 (如 跳 转 指令 .调用 指令 等 ) 是 否 可 以 避免 发 生 控制 冒险 ? 

答 : 可 能 会 发 生 控 制 冒险 。 如 果 不 是 把 取 指 令 操 作 和 译 码 操 作 合成 一 个 阶段 ,就 会 引 
起 控制 冒险 。 因 为 要 等 到 译 码 阶段 才能 知道 是 转移 指令 ,而 此 时 流水 线 中 正在 取 下 一 条 顺 
序 执行 的 指令 ,即使 译 码 阶段 能 够 得 到 转移 目标 地 址 ,也 已 经 有 一 条 不 该 执行 的 指令 在 流水 
线 中 , 即 流水 线 被 阻塞 了 一 个 时 钟 周 期 。 在 下 一 个 时 钟 到 达 时 ,应 把 已 经 取出 的 下 一 条 指令 
清 “0”, 并 把 转移 目标 地 址 送 PC, 重 新 从 转移 目标 地 址 处 取 指 令 执 行 。 

12. 流水 线 中 如 何 控制 在 同一 时 钟 内 各 流水 段 中 执行 不 同 的 指令 ? 

答 : 对 于 每 条 指令 来 说 , 流水 线 中 前 面 的 取 指 令 流 水 段 和 指令 译 码 流水 段 , 都 是 一 样 
的 。 所 以 这 两 个 流水 段 中 的 操作 没有 必要 和 哪个 指令 对 应 。 但 是 ,指令 译 码 以 后 ,每 个 流水 
段 中 执行 的 动作 一 定 要 和 特定 的 指令 对 应 ,也 就 是 说 ,特定 指令 对 应 的 控制 信号 一 定 要 送 到 
对 应 的 流水 段 中 ,以 控制 该 流水 段 中 的 执行 部 件 完 成 正确 的 动作 。 这 样 也 就 可 以 控制 在 同 
一 时 钟 内 各 流水 段 执行 不 同 的 指令 。 要 做 到 特定 指令 对 应 的 控制 信号 送 到 对 应 的 流水 段 
中 ,只 要 将 译 码 阶 段 得 到 的 控制 信号 也 以 流水 线 的 方式 传送 ,每 来 一 个 时 钟 , 控 制 信号 就 往 
后 面 一 个 流水 段 传送 一 次 ,这 样 使 得 控制 信号 和 所 控制 的 操作 同步 。 

13. 指令 译 码 前 控制 信号 还 没有 产生 ,那么 如 何 控制 译 码 前 指令 的 动作 呢 ? 

答 : 任何 指令 总 是 先 要 取 指 令 , 然 后 对 指令 译 码 , 最 后 根据 指令 的 不 同 产生 不 同 的 控制 
信和 号 ,控制 数据 通路 完成 不 同 的 指令 功能 。 也 就 是 说 ,在 指令 译 码 前 控制 信号 还 没有 产生 ， 
所 以 ,不 可 能 有 控制 信号 来 控制 译 码 前 指令 的 动作 ,而 且 也 不 需要 控制 信号 来 控制 译 码 前 指 
令 的 动作 ,其 原因 是 因为 这 些 动作 每 条 指令 都 一 样 ,是 确定 的 。 取 指令 /PC 十 4、 译 码 / 读 寄 
存 器 ,而 这 些 操作 都 可 以 不 在 控制 信号 的 控制 下 进行 。 


7.5 单项 选择 题 


1. 以 下 关于 指令 流水 线 设计 的 叙述 中 ,错误 的 是 (。 )。 
A. 指令 执行 过 程 中 的 各 个 子 功 能 都 须 包 含 在 某 个 流水 段 
B. 所 有 子 功能 都 必须 按 一 定 的 顺序 经 过 流水 段 


十 
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C. 虽然 各 子 功能 所 用 实际 时 间 可 能 不 同 ,但 经 过 每 个 流水 段 的 时 间 都 一 样 
D. 任何 时 候 各 个 流水 段 的 功能 部 件 都 不 可 能 执行 空 (nop) 操 作 
2. 以 下 关于 流水 段 寄 存 器 的 叙述 中 ,正确 的 是 (  )。 
A. 指令 译 码 得 到 的 控制 信号 需 通 过 流水 段 寄 存 器 传递 到 后 面 的 流水 段 
B. 每 个 流水 段 之 间 的 流水 段 寄存 器 位 数 一 定 相同 
C. 每 个 流水 段 之 间 的 流水 段 寄 存 器 存放 的 信息 一 定 相同 
D， 用 户 程 序 可 以 通过 指令 指定 访问 哪个 流水 段 寄 存 器 
3. 以 下 关于 指令 流水 线 和 指令 执行 效率 关系 的 叙述 中 ,错误 的 是 (  )。 
A. 加 倍增 加 流水 段 个 数 不 能 成 倍 提高 指令 执行 效率 
B. 随 着 流水 段 个 数 的 增加 ,流水 段 之 间 缓 存 开销 的 比例 增 大 
C. 加 深 流水 线 深度 ,可 以 提高 处 理 器 的 时 钟 频率 
D. 为 了 提高 指令 吞吐 率 ,流水 段 个 数 可 以 无 限制 地 增多 
4， 以 下 有 关 流 水 线 数据 通路 的 描述 中 ,错误 的 是 (  )。 
A. 每 个 流水 段 由 执行 指令 子 功能 的 功能 部 件 和 流水 段 寄 存 器 组 成 
B. 控制 信号 仅 作用 在 功能 部 件 上 ,时 钟 信号 仅 作用 在 流水 段 寄存 器 上 
C. 在 没有 阻塞 的 情况 下 ,PC 的 值 在 每 个 时 钟 周期 都 会 改变 
D. 取 指 令 阶段 和 指令 译 码 阶段 不 需要 控制 信号 的 控制 
5. 某 计 算 机 的 指令 流水 线 由 4 个 功能 段 组 成 ,指令 流 经 各 功能 段 的 时 间 ( 忽 略 各 功能 
段 之 间 流 水 段 寄 存 器 的 缓存 时 间 ) 分 别 为 90ns、80ns、70ns 和 60ns, 则 该 计算 机 的 CPU 时 钟 
周期 至 少 是 (。 )。 
A. 90ns B. 80ns C. 70ns D. 60ns 
6, 假定 执行 最 复杂 的 指令 需要 完成 6 个 子 功能 ,分 别 由 对 应 的 功能 部 件 A~F 来 完 
成 ,每 个 功能 部 件 所 花 的 时 间 分 别 为 80ps、40ps、50ps、70ps、20ps、30ps, 流 水 线 寄 存 器 延 时 
为 20ps, 现 把 最 后 两 个 功能 部 件 下 和 下 合并 ,以 产生 一 个 五 段 流水 线 。 该 五 段 流水 线 的 时 
钟 周期 至 少 是 ( )ps。 
A. 70 B. 80 C. 90 D. 100 
7. 以 下 有 关 流 水 段 的 功能 部 件 的 描述 中 ,错误 的 是 (  )。 
A. 所 有 功能 部 件 都 是 用 组 合 逻 辑 实现 
B. 同一 个 功能 部 件 可 以 在 不 同 的 流水 段 中 被 使 用 
C. 每 个 功能 部 件 在 每 条 指令 中 都 只 被 用 一 次 
D. 寄存 器 写 口 只 能 在 指令 结束 时 的 “ 写 回 ”阶段 被 用 
8. 以 下 给 定 的 情况 中 ,不 会 引起 指令 流水 线 阻 塞 的 是 ( )。 


A. 访 存 冲 突 B. 指令 数据 相关 
C. 执行 空 操作 指令 D. cache 缺失 

9 以 下 给 定 的 情况 中 ,不 会 引起 指令 流水 线 阻塞 的 是 ( )。 
A. 数据 旁 路 (转发 ) B. TLB 缺失 
C. 条 件 转移 D. 外 部 中 断 


10. 以 下 是 关于 结构 冒险 的 叙述 : 
@ 结构 冒险 是 指 同 时 有 多 条 指令 使 用 同一 个 资源 


| 7 
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| @ 避免 结构 冒险 的 基本 做 法 是 使 每 个 指令 在 相同 流水 段 中 使 用 相同 的 部 件 
| @ 重复 设置 功能 部 件 可 以 避免 结构 冒险 
| @ 数据 cache 和 指令 cache 分 离 可 解决 同时 访问 数据 和 指令 的 冒险 

以 上 叙述 中 ,正确 的 有 (  )。 

A. 0.O.@ B. 0O.O.@ C. OO.@ D, 全 部 
11. 以 下 是 关于 数据 骨 险 的 叙述 : 

G@ 数据 冒险 是 指 后 面 指令 用 到 的 数据 还 未 来 得 及 由 前 面 指令 产 4 

@ 在 发 生 数 据 冒 险 的 指令 之 间 插 入 空 操作 指令 能 避免 数据 冒险 

@ 采用 转发 ( 旁 路 ) 技 术 可 解决 部 分 数据 冒险 

@ 通过 编译 器 调整 指令 顺序 可 解决 部 分 数据 骨 险 

以 上 叙述 中 ,正确 的 有 ( 。 )。 

A. 0.O.Q@ B. 0O.O.@ Cc. DO.@ D. 全 部 
12， 以 下 是 关于 控制 骨 险 的 叙述 : 

@ 条 件 转移 指令 执行 时 可 能 会 发 生 控制 骨 险 

@ 在 分 支 指令 后 加 入 若干 空 操作 指令 可 避免 控制 冒险 

@ 采用 转发 ( 旁 路 ) 技 术 可 以 解决 部 分 控制 骨 险 

@ 通过 编译 器 调整 指令 顺序 可 解决 部 分 控制 骨 险 

以 上 叙述 中 ,正确 的 有 ( 。 )。 

A. 0.O.@ B. DO C. ODO.@ D. 全 部 
13. 以 下 是 有 关 分 支 预测 的 叙述 : 

@ 分 支 预测 技术 可 用 于 控制 骨 险 和 数据 骨 险 处 理 

@ 采用 静态 预测 技术 时 ,每 次 的 预测 结果 总 是 一 样 

@ 通常 情况 下 ,动态 预测 比 静态 预测 的 预测 成 功率 高 

@ 预测 错误 时 已 被 错误 地 取 到 流水 线 执行 的 指令 必须 被 冲刷 掉 

以 上 叙述 中 ,正确 的 有 ( 。 “)。 

A. 0.O.@ B. ODO.@ C. OO.@ D. 全 部 
14. 以 下 是 一 段 MIPS 指令 序列 : 


出 


1 loop: add :Stl $83, $93 #R[ISt1]<—R[$s3]+R[$s3] 

2 add S$tl1, $t1l, $t1 #R[ISt1]<R[I$t1]+R[$t1] 

3 lw $t0, O($t1) #R[I$t0]<MI[IR[$t1]+0] 

4 bne $t0, $s5, exit #if (RISt0] 天 RI[$s5]) then go to exit 
5 add $s3, $s3, $s4 #R[$s3]<R[$s3]+R[$s4] 

6 了 loop #go to loop 

7 exit: 


以 上 指令 序列 中 ,第 (  ) 行 指令 产生 了 一 个 分 支 控制 胃 险 。 
A. 2 B. 4 C. 5 D. 7 
15. 以 下 是 一 段 MIPS 指令 序列 : 


二 add S$tl, $t0, $t1 #R[IS$t1]<R[IS$tO0]+R[$t1] 
lw S$t0, 0($t1) #R[$Tt0]<M[IRI$t1]+0] 
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3 bne S$t0, $s5, exit #if(R[$t0]AR[$s5]) then go to exit 
4 add $s3, $s5, $s4 #R[$s3]<R[I$s5]+R[$s4] 
1 exit; 
以 上 指令 序列 中 ,( ) 指 令 之 间 产 生 数 据 相 关 。 
A.1 和 2、2 和 3 B.1 和 2、2 和 3、3 和 4 
C.1 和 2、1 和 3 D. 1 和 2、1 和 3、 2 和 3 
16. 以 下 是 一 段 MIPS 指令 序列 : 
1 addi $tl1, $zero, 20 #R[$t1]<20 
2 lw $t2, 12($a0) #R[$t2]<-M[R[$a0]+12] 
3 add $vO, $t1l, $t2 #R[IS$vO]<-R[$t1]+R[$t2] 


以 上 指令 序列 中 ,第 1 和 第 3、 第 2 和 第 3 条 指令 之 间 发 生 数 据 相 关 。 假 定 采 用 
“ 取 指 、 译 码 / 取 数 、 执 行 \ 访 存 、 写 回 ” 这 种 五 段 流 水 线 方式 ,并 控制 在 时 钟 周期 的 前 
半 周 期 写 寄存 器 堆 后 半 周 期 读 寄存 器 堆 , 那 么 不 采用 “转发 ”技术 时 ,需要 在 第 3 条 
指令 前 加 入 ( ””) 条 空 操作 (nop) 指 令 才能 使 这 段 程序 不 发 生 数 据 冒险 。 
A, 1 B. 2 C, 3 D. 4 

17. 以 下 是 一 段 MIPS 指令 序列 : 


让 addi $tl, $zero, 20 #R[$t1]<—20 
2 JW $t2, 12($a0) #R[$t2]<M[IR[$a0]+12] 
3 add $vO, $tl, $t2 #R[$vO]<R[I$t1]+R[$t2] 


以 上 指令 序列 中 ,第 1 和 第 3、 第 2 和 第 3 条 指令 之 间 发 生 数 据 相 关 。 假 定 采 用 
“ 取 指 、 译 码 / 取 数 \ 执 行 , 访 存 、 写 回 ” 这 种 五 段 流水 线 方式 ,那么 在 采用 “转发 ”技术 
时 ,需要 在 第 3 条 指令 前 加 入 ( ”) 条 空 操作 (nop) 指 令 才能 使 这 段 程序 不 发 生 
数据 冒险 。 
A. 0 B. 1 C.2 D. 3 

18. 以 下 有 关 超 标量 技术 的 叙述 中 ,错误 的 是 ( )。 
A. 超标 量 技术 是 指 在 流水 线 中 采用 更 多 的 流水 段 个 数 
B. 超标 量 方式 执行 指令 时 可 以 同时 发 射 多 条 指令 至 流水 线 中 
C. 采用 超标 量 技术 的 CPU 中 必须 配置 多 个 不 同 的 功能 部 件 
D. 采用 超标 量 技术 的 目的 是 利用 部 件 的 并 行 性 以 提高 指令 吞吐 率 


【参考 答案 】 

1. D 2. 人 3. D 4.B 5.A 6.D 7. B 
8.C 9. A 10. D 11. D 12. A 13. C 14. B 
15. A 16. B 17. B 18. A 


7.6 分 析 应 用 题 


1. 假定 某 计算 机 工程 师 想 设 计 一 个 新 CPU, 其 中 运行 的 一 个 典型 程序 的 核心 模块 有 
一 百 万 条 指令 ,每 条 指令 执行 时 间 为 100ps。 
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(1) 在 非 流 水 线 处 理 器 上 执行 该 程序 大 约 需 要 花 多 长 时 间 ? 

(2) 车 新 CPU 是 一 个 20 级 流水 线 处 理 器 ,执行 上 述 同样 的 程序 ,理想 情况 下 , 它 比 非 
流水 线 处 理 器 快 多 少 ? 

(3) 实际 流水 线 并 不 是 理想 的 ,流水 段 之 间 的 数据 传送 会 有 额外 开销 。 这 些 开 销 是 否 
会 影响 指令 执行 时 间 (Instruction Latency) 和 指令 吞吐 率 (Instruction Throughput)? 

【分 析 解 答 】 

(1) 非 流 水 线 处 理 器 上 执行 该 程序 的 时 间 大 约 为 100psX10s 二 100ps。 

(2) 若 在 一 个 20 级 流水 线 的 处 理 器 上 执行 ,忽略 流水 段 之 间 的 寄存 器 延 时 ,理想 情况 
下 ,每 个 时 钟 周期 为 100/20 二 5ps, 所 以 ,程序 执行 时 间 大 约 为 5psX10 二 5ps, 因 此 ,大 约 快 
100/5 二 20 信 。 

(3) 流水 段 之 间 数 据 的 传递 产生 的 额外 开销 ,使 得 一 条 指令 的 执行 时 间 被 延长 , 即 影响 
了 指令 执行 时 间 ; 同 时 也 延长 了 每 个 流水 段 的 时 间 , 即 影响 了 指令 吞吐 率 。 

2. 某 计 算 机 指令 流水 线 由 6 个 功能 段 组 成 ,依次 为 A~ 下 ,每 个 功能 段 的 组 合 迎 辑 延迟 
分 别 为 80ps、30ps、60ps、50ps、60ps、20ps, 最 后 一 个 功能 段 需 要 写 寄存 髓 ,寄存 器 延 时 为 
20ps。 在 这 些 组 合 逻 辑 块 之 间 插 入 必要 的 流水 段 寄 存 器 就 可 实现 相应 的 指令 流水 线 。 理 想 
情况 下 ,以 下 各 种 方式 所 得 到 的 时 钟 周期 、 指 令 吞 吐 率 和 指令 执行 时 间 各 是 多 少 ? 应 该 在 哪 
里 插入 流水 段 寄 存 器 (假定 插入 的 流水 段 寄 存 器 的 延 时 也 为 20ps)? 根据 对 以 下 4 种 情况 
的 分 析 , 你 能 得 到 什么 结论 ? 

(1) 插入 一 个 流水 段 寄 存 器 ,得 到 一 个 两 级 流水 线 。 

(2) 插 人 两 个 流水 段 寄 存 器 ,得 到 一 个 三 级 流水 线 。 

(3) 插 人 三 个 流水 段 寄 存 器 ,得 到 一 个 四 级 流水 线 。 

(4) 吞吐 量 最 大 的 流水 线 。 

【分 析 解 答 】 

(1) 两 级 流水 线 的 平衡 点 在 C 和 了 之 间 , 其 前 面 一 个 流水 段 的 组 合 逻辑 延 时 为 80 十 30 十 
60 王 170ps, 后 面 一 个 流水 段 的 组 合 逻 辑 延 时 为 50 十 60 十 20 二 130ps。 因 而 最 长 功能 段 延 时 为 
170ps, 加 上 流水 段 寄 存 器 延 时 20ps, 因 而 时 钟 周期 为 190ps, 理 想 情 况 下 ,指令 吞吐 率 为 每 秒 钟 
执行 1/(190X10-) 二 5.26G 条 指令 。 每 条 指令 在 流水 线 中 的 执行 时 间 为 2X190 二 380ps。 

(2) 两 个 流水 段 寄 存 器 分 别 插 在 B 和 C.D 和 下 之 间 , 这 样 第 一 个 流水 段 的 组 合 逻 辑 延 
时 为 80 十 30 二 110ps, 中 间 第 二 段 的 延 时 为 60 十 50 王 110ps, 最 后 一 个 段 延 时 为 60 十 20 一 
80ps。 这 样 ,每 个 流水 段 所 用 时 间 都 按 最 长 延 时 调整 为 110 十 20 二 130ps, 故 时 钟 周期 为 
130ps, 指令 吞吐 率 为 每 秒 钟 执行 1/(130X10-2) 王 7. 69G 条 指令 ,每 条 指令 在 流水 线 中 的 
执行 时 间 为 3X130 一 390ps。 

(3) 3 个 流水 段 寄存 器 分 别 插 在 A 和 BC 和 DD 和 下 之 间 , 这 样 第 一 个 流水 段 的 组 合 
逻辑 延 时 为 80ps, 第 二 段 延 时 为 30 十 60 二 90ps, 第 三 段 延 时 为 50ps, 最 后 一 段 延 时 为 
60 十 20 王 80ps。 这 样 ,每 个 流水 段 都 以 最 长 延 时 调整 为 90 十 20 一 110ps, 故 时 钟 周期 为 
110ps, 指 令 吞 吐 率 为 每 秒 钟 执行 1/(110X10-2)=9.09G 条 指令 ,每 条 指令 在 流水 线 中 的 
执行 时 间 为 4X110 一 440ps。 

(4) 因为 各 功能 部 件 对 应 的 组 合 逻 辑 中 最 长 延 时 为 80ps, 所 以 ,流水 线 的 时 钟 周期 肯定 
比 80ps 十 20ps 一 100ps 长 。 为 达到 最 大 吞吐 率 ,时 钟 周期 应 尽量 短 , 因 此 ,最 合理 的 划分 方 
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案 应 按照 每 个 时 钟 周 期 为 100ps 来 进行 。 根 据 每 个 功能 部 件 所 用 时 间 可 知 ,流水 线 至 少 按 
5 段 来 划分 ,分 别 把 流水 段 寄 存 器 插入 A 和 BB 和 CC 和 DD 和 下 之 间 , 这 样 各 段 的 组 合 逻 
辑 延 时 为 80ps、30ps、60ps、50ps 和 80ps。 其 中 ,最 后 一 个 延 时 80ps 由 EE 和 下 两 个 阶段 的 时 间 
相 加 得 到 。 这 样 时 钟 周 期 为 100ps, 指 令 吞 吐 率 为 每 秒 钟 执行 1/(100X10-2)=10G 条 指令 ， 
每 个 指令 的 执行 时 间 为 5X100 一 500ps。 

通过 对 上 述 4 种 情况 进行 分 析 , 可 以 得 出 以 下 结论 : 划分 的 流水 段 多 ,时 钟 周期 就 变 
短 ,指令 执行 吞吐 率 就 变 高 ,而 相应 的 额外 开销 (插入 的 流水 段 寄 存 器 的 延 时 ) 也 变 大 ,使 得 
一 条 指令 的 执行 时 间 变 长 。 

3. 假定 在 如 图 7. 1 所 示 的 五 级 流水 线 处 理 器 中 ,各 主要 功能 部 件 的 操作 时 间 如 下 。 存 
储 器 : 200ps; ALU 或 加 法 器 : 150ps; 寄 存 器 堆 读 口 或 写 口 : 50ps。 请 回答 下 列 问题 ; 

(1) 若 执行 阶段 EX 所 用 的 ALU 操作 时 间 缩 短 20% , 则 能 否 加 快 流水 线 执行 速度 ? 如 
果 能 ,能 加 快 多 少 ? 如 果 不 能 ,为 什么 ? 

(2) 若 ALU 操作 时 间 增 加 20% ,对 流水 线 的 性 能 有 何 影响 ? 

(3) 若 ALU 操作 时 间 增 加 40% ,对 流水 线 的 性 能 又 有 何 影响 ? 

【分 析 解 答 】 

(1) ALU 操作 时 间 缩 短 20% 不 能 加 快 流水 线 执行 速度 。 因 为 指令 流水 线 的 执行 速度 
取决 于 最 慢 的 功能 部 件 所 用 时 间 , 最 慢 的 是 存储 器 ,只 有 缩短 了 存储 器 的 操作 时 间 才 可 能 加 
快 流水 线 速 度 。 

(2) ALU 操作 时 间 延 长 20% 时 , 变 成 了 180ps, 比 存储 器 所 用 时 间 200ps 还 小 ,因此 ,对 
流水 线性 能 没有 影响 。 

(3) ALU 操作 时 间 延 长 40% 时 , 变 成 了 210ps, 比 存储 器 所 用 时 间 200ps 大 ,因此 ,在 不 
考虑 流水 段 寄 存 器 延 时 的 情况 下 ,流水 线 的 时 钟 周期 从 200ps 变 为 210ps, 流 水 线 执行 速度 
降低 了 (210 一 200)/200 一 5%%。 

4. 下 面 是 一 段 MIPS 指令 序列 : 


1 add $t1, $s1l, $s0 
2 sub $t2, $s0, $s3 
EE add $t1l, $t1, $t2 


假定 在 一 个 采用 “ 取 指 、 译 码 / 取 数 、 执 行 、 访 存 、 写 回 ” 的 五 段 流 水 线 处 理 器 中 执行 上 述 
指令 序列 ,请 回答 下 列 问题 : 

(1) 以 上 指令 序列 中 ,哪些 指令 之 间 发 生 数据 相关 ? 

(2) 不 采用 “转发 ”技术 的 话 , 需 要 在 何 处 .加 入 几 条 nop 指令 才能 使 这 段 指令 序列 的 执 
行 避免 数据 冒险 ? 

(3) 如 果 采 用 “转发 ”技术 ,是 否 可 以 完全 解决 数据 冒险 ? 不 行 的话 , 需 要 在 何 处 .加 入 
几 条 nop 指令 才能 使 这 段 指 令 序 列 的 执行 避免 数据 冒险 ? 

【分 析 解 答 】 

(1) 因为 第 1 条 和 第 2 条 指令 都 会 更 新 第 3 条 指令 用 到 的 寄存 器 的 值 ,有 可 能 导致 第 
3 条 指令 取 操作 数 时 得 到 的 是 更 新 前 的 数据 ,这 样 第 3 条 指令 就 不 能 正确 执行 ,因此 ,第 
1 条 和 第 3 条 指令 .第 2 条 和 第 3 条 指令 之 间 发 生 的 数据 相关 。 
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(2) 不 进行 “转发 "的话, 就 只 能 通过 在 第 3 条 指令 前 加 nop 指令 来 延迟 第 3 条 指令 的 
执行 。 因 为 只 有 第 2 条 指令 把 数据 写 回 到 $ 世 ,第 3 条 指令 才能 从 $t2 取 到 正确 的 值 ,所 
以 ,第 2 条 指令 的 “ 写 


回 (Wr)” 流 水 段 后 面 才 应 该 是 第 3 条 指令 的 “ 译 码 / 取 数 (ID)” 流 水 段 ， 
为 此 ,在 第 2 条 和 第 3 条 指令 之 间 必 须 插 入 3 条 nop 指令 ,如 图 7.5 所 示 。 
Time (Clock Cycles) 
下 1 [Mem | Wr 1 | 
1 1 1 1 
| | | 1 | 
add Stl, $sl, $s0 | IM 站 | Reg mil DM | 车 。 | | 
ER 
sub S$t2, $s0, $s3 | IM | 译 7 lt DM H 民 :| | 
| | | | 
1 1 !| > 1 
nop | HiReg | | > 下 DM H 
1 1 中 二 | 一 | 
| 1 | | 
nop | 上 | IM HI Reg 二 | 
| | | | 
1 1 | ' 
nop 1 | 1 IM HI Reg 下 
| | | | 
1 1 1 1 
add $t1, Stl, $t2 | | | IM |H 


图 7.5 题 4 的 图 示 1 


若 将 寄存 器 写 口 和 寄存 器 读 口 分 别 安排 在 一 个 时 钟 周期 的 前 、 后 半 个 周期 内 独立 工作 ， 
使 得 前 半 周 期 写 人 寄存 器 的 内 容 在 后 半 周 期 能 够 正确 读 出 ,那么 ,只 要 加 入 两 条 nop 指令 
即 可 ,如 图 7.6 所 示 。 


Time (Clock Cycles) 
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(3) 采用 “转发 "技术, 上述 程 序 段 可 以 完全 避免 数据 冒险 。 只 要 把 第 1 条 指令 “ 访 存 
(Mem)” 段 结束 时 在 流水 段 寄存 器 中 的 $tl 的 值 和 第 2 条 指令 “执行 (Ex)” 段 结束 时 在 流水 
段 寄 存 器 中 的 $t2 的 值 同时 “转发 "到 第 3 条 指令 的 “执行 (Ex)” 段 内 ALU 的 两 个 输入 端 ， 
这 样 ,在 ALU 中 运算 的 两 个 操作 数 都 是 正确 的 值 ,不 会 发 生 数据 冒险 ,无 须 再 插入 nop 指 
令 , 如 图 7.7 所 示 。 


Time (Clock Cycles) 


IF 1 ID | Ex IMem | Wr 1 1 1 
上 1 1 1 1 1 1 
上 1 1 1 1 1 1 
才 HH | 1 1 1 1 1 
add $tl, $s1, $50 | IM | Reg |! > 己 | DM pH Reg | | | 
1 1 1 1 1 1 
1 | 1 1 1 1 
上 1 1 > 1 1 1 
sub $t2, $s0, $s3 (| Mm Res | >E pl DM pH Reg |! ! 
1 1 由 之 1 | | 
be i 
上 1 
> 
add Stl, $1, S2 mae ll>E ph pm bree|! 
| 1 1 1 mm | 1 
1 1 1 | 1 1 1 
1 1 1 1 1 


图 7.7 题 4 的 图 示 3 


5. 下 面 是 一 段 MIPS 指令 序列 : 


add $s3, $sl, $s0 
add $t2, $s0, $s3 
1w $t1,0($t2) 

add $tl, $t1l, $t2 

假定 在 一 个 采用 “ 取 指 、 译 码 / 取 数 、 执 行 、 访 存 、 写 回 ” 的 五 段 流水 线 处 理 器 中 执行 上 述 
指令 序列 ,该 流水 线 数据 通路 中 ,寄存 器 写 口 和 寄存 器 读 口 分 别 安排 在 一 个 时 钟 周期 的 前 、 
后 半 个 周期 内 独立 工作 。 请 回答 下 列 问题 : 

(1) 以 上 指令 序列 中 ,哪些 指令 之 间 发 生 数据 相关 ? 

(2) 不 采用 “转发 ”技术 的 话 , 需 要 在 何 处 、 加 入 几 条 nop 指令 才能 使 这 段 指 令 序列 的 执 
行 避免 数据 冒险 ? nop 指令 增加 的 百分比 为 多 少 ? 该 指令 序列 的 执行 共 需 要 多 少时 钟 
周期 ? 

(3) 如 果 采 用 "转发 ”技术 ,是 否 可 以 完全 解决 数据 冒险 ? 不 行 的 话 ,需要 在 何 处 、 加 入 
几 条 nop 指令 才能 使 这 段 指令 序列 的 执行 避免 数据 冒险 ? 

(4) 若 数 据 冒 险 通过 硬件 阻塞 进行 处 理 , 则 在 不 采用 “转发 "和 采用 “转发 ”两 种 情况 下 ， 
执行 上 述 4 条 指令 的 CPI 分 别 是 多 少 ? 

【分 析 解 答 】 

(1) 发 生 数据 相关 的 是 : 第 1 条 和 第 2 条 指令 之 间 关 于 $ s3 ,第 2 条 和 第 3 条 指令 之 间 
关于 $t2, 第 2 条 和 第 4 条 指令 之 间 关 于 $t2, 以 及 第 3 条 和 第 4 条 指令 之 间 关 于 $tl。 

(2) 不 进行 “转发 ”处 理 的 话 , 需 要 分 别 在 第 2、.3、4 条 指令 前 加 2 条 nop 指令 才能 避免 
数据 冒险 , 共 加 了 6 条 nop 指令 。nop 指令 增加 的 百分比 为 6/4 二 150%, 即 平均 1 条 指令 加 
1.5 条 nop 指令 。 该 指令 序列 执行 所 需要 的 时 钟 周期 数 为 (5 一 1) 十 (4 十 6) 一 14。 

(3) 通过 “转发 "可 以 避免 第 1 和 第 2、 第 2 和 第 3、 第 2 和 第 4 条 指令 之 间 的 数据 相关 ; 


AODNDP 
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但 第 3 和 第 4 条 指令 之 间 是 Load-use 数据 相关 ,因此 ,无 法 用 “转发 ”消除 冒险 ,而 需 在 第 
4 条 指令 前 加 入 1 条 nop 指令 。 

《4) 数据 冒险 通过 硬件 阻塞 进行 处 理 时 ,如 不 采用 “转发 ”来 执行 上 述 4 条 指令 , 则 需要 
的 时 钟 周期 数 为 14, 故 CPI 为 14/4= 二 3.5。 若 采用 “转发 ”来 执行 上 述 4 条 指令 , 则 需要 时 钟 
周期 数 为 (5 一 1) 十 (4 十 1) 二 9, 故 CPI 为 9/4 一 2.25。 

6. 下 面 是 一 段 MIPS 指令 序列 : 


add $t1l, $sl, $s0 
sub $t2, $s0, $s3 
$t0, 0($t2) 
add $s0, $t0, $s2 
add $t1, $s0, $t2 

假定 在 一 个 采用 “ 取 指 、 译 码 / 取 数 、 执 行 、 访 存 、 写 回 ” 的 五 段 流水 线 处 理 器 中 执行 上 述 
指令 序列 ,并 且 该 处 理 器 采用 了 “转发 "和 “Load-use 冒险 处 理 ” 技 术 , 则 在 第 5 个 时 钟 周期 
内 ,各 指令 的 执行 情况 如 何 ? 哪些 寄存 器 的 内 容 正在 被 读 ? 哪些 寄存 器 将 被 写 人 数据 ? 

【分 析 解 答 】 

在 一 个 如 图 7.4 所 示 的 带 “Load-use 冒险 处 理 ” 和 “转发 ”技术 的 五 阶段 流水 线 数 据 通 
路 中 执行 上 述 指令 序列 , 则 第 5 个 时 钟 周期 内 各 条 指令 的 执行 情况 如 下 。 

第 1 条 指令 在 “ 写 回 (Wr) ”阶段 ,寄存 器 tl 将 被 写 人 。 

第 2 条 指令 在 “ 访 存 (Mem) ”阶段 ,sub 指令 在 该 阶段 进行 的 是 空 操作 ;在 转发 检测 单元 
中 ,因为 流水 段 寄存 器 Ex/Mem 中 的 目的 寄存 器 RegRd 为 $t2 ,流水 段 寄存 器 ID/Ex 中 的 
源 寄存 器 Rs 也 为 $t2, 同 时 ,流水 段 寄 存 器 Ex/Mem 中 的 RegWr 控制 信号 为 1, 所 以 检测 
到 转发 条 件 满足 ,因而 ,此 时 ,sub 指令 在 上 一 个 时 钟 周 期 中 的 执行 结果 (在 流水 段 寄存 器 
Ex/Mem 中 的 ALU 输出 结果 ) 正 被 回 送 到 ALU 的 输入 端 。 

第 3 条 指令 在 “执行 (Ex)” 阶 段 ,ALU 正在 执行 add 操作 ,进行 地 址 运算 ,ALU 输出 结 
果 将 被 写 信 流水线 寄存 器 Ex/Mem 中 。 

第 4 条 指令 在 “ 译 码 / 取 数 (ID)” 阶 段 ,寄存 器 $t0 和 $s2 的 内 容 正 被 读 出 ;在 Load-use 
崩 险 检测 单元 中 ,因为 流水 段 寄存 器 IE/ID 中 源 操作 数 寄存 器 Rs 为 $t0 ,流水 段 寄存 器 ID/Ex 
中 目的 操作 数 寄存 器 Rt 也 为 $t0, 同 时 ,因为 上 一 条 指令 是 lw, 故 流水 段 寄存 器 ID/Ex 中 的 
MemRead 控制 信号 为 1, 所 以 在 该 阶段 检测 到 Load-use 冒险 条 件 满足 ,此 时 ,需要 进行 
Load-use 冒险 处 理 , 在 流水 线 中 插入 一 个 “气泡 ”, 将 指令 的 执行 阻塞 一 个 时 钟 周期 。 包括 
以 下 3 个 步骤 : (1) 将 流水 段 寄 存 器 ID/Ex 中 的 控制 信号 全 部 清 “0”, 以 保证 第 4 条 指令 被 
阻塞 一 个 时 钟 周期 执行 ;(2) 将 流水 段 寄存 器 IF/ID 中 的 指令 维持 不 变 , 以 保证 第 4 条 指令 
重新 译 码 后 执行 ;(3) 将 PC 的 值 维持 不 变 ,以 保证 根据 PC 的 值 重新 取出 第 5 条 指令 。 

第 5 条 指令 在 “IF 阶段 ,指令 正 被 读 出 ,将 要 送 到 流水 段 寄 存 器 I 下/ID 的 输入 端 。 因 为 
之 前 发 生 了 Load-use 数据 冒险 ,所 以 该 指令 将 在 随后 的 第 6 个 时 钟 周期 内 重新 被 读 出 。 

7. 以 下 是 一 段 MIPS 指令 序列 : 


o 中 ww Nm 
局 
后 


1 loop: add $t1l, $s3, $s3 
2 add $t1l, $t1, $t1 
add $t1, $t1l, $s6 


毕 令 流 冰 线 


4 1w $tO, 0($t1) 

5 bne $t0, $s5, exit 
6 add $s3, $s3, $s4 
7 3 loop 

8 exit: 


假定 在 一 个 采用 “ 取 指 、 译 码 / 取 数 、 执 行 . 访 存 、 写 回 ” 的 五 段 流水 线 中 执行 上 述 指 令 序 
列 ,该 流水 线 数据 通路 中 ,寄存 器 写 口 和 寄存 器 读 口 分 别 安 排 在 一 个 时 钟 周期 的 前 、 后 半 个 
周期 内 独立 工作 。 要 求 回答 下 列 问题 : 

(1) 哪些 指令 之 间 发 生 数据 相关 ? 哪些 指令 的 执行 会 发 生 控 制 相关 ? 

《2) 如 果 不 采用 “转发 ”技术 进行 数据 冒险 处 理 , 那 么 应 该 在 何 处 、 加 入 几 条 nop 指令 才 
能 避免 数据 冒险 ? 假定 采用 “转发 ”技术 处 理 , 是 否 可 以 完全 解决 数据 冒险 ? 不 行 的 话 ,需要 
在 发 生 数据 相关 的 指令 前 加 入 几 条 nop 指令 ,才能 使 这 有 段 指令 序列 的 执行 避免 数据 冒险 ? 

(3) 对 于 第 5 条 分 支 指令 引起 的 控制 冒险 (分 支 冒险 ) ,假定 将 检测 结果 是 否 为 “ 零 ” 并 
更 新 PC 的 操作 放 在 “ 访 存 (Mem) ”阶段 进行 , 则 分 支 延 迟 损失 时 间 片 (分 支 延迟 权 ) 为 多 少 ? 
在 何 处 .加 入 几 条 nop 指令 可 以 消除 分 支 胃 险 ? 若 检 测 结果 是 否 为 “ 零 ”并 更 新 PC 的 操作 
在 “执行 (Ex)” 阶 段 进 行 , 则 分 支 延迟 损失 时 间 片 (分 支 延 迟 槽 ) 为 多 少 ? 

(4) 对 于 第 7 条 指令 “j loop”, 假 定 更 新 PC 的 操作 在 “执行 (Ex)” 阶 段 进行 , 则 流水 线 会 
被 阻塞 几 个 时 钟 周期 ? 需要 在 何 处 .加 和 人 几 条 nop 指令 才 可 消除 该 控制 骨 险 ? 假定 更 新 PC 
的 操作 在 “ 译 码 (ID)” 阶 段 进行 , 则 流水 线 又 将 被 阻塞 几 个 时 钟 周期 ? 

【分 析 解 答 】 

(1) 发 生 数 据 相 关 的 是 : 第 1 和 第 2 条 指令 之 间 关 于 $tl, 第 2 和 第 3 条 指令 之 间 关 于 
$tl, 第 3 和 第 4 条 指令 之 间 关 于 $tl, 第 4 和 第 5 条 指令 之 间 关 于 $t0, 以 及 第 6 和 第 1 条 
指令 之 间 关 于 $ s3。 此 外 ,第 5 和 第 7 条 指令 的 执行 都 会 发 生 控 制 相关 。 

《2) 对 于 数据 冒险 ,如 果 不 采用 “转发 ”, 而 是 简单 地 通过 加 入 nop 指令 来 避免 冒险 , 那 
么 应 该 在 第 2、3、4、5 条 指令 前 各 加 2 条 nop 指令 ,以 消除 数据 相关 ;对 于 第 6 条 和 第 1 条 指 
令 之 间 的 数据 相关 , 则 可 通过 在 第 7 条 “j loop” 指 令 后 面 加 一 条 或 两 条 nop 指令 消除 (这 样 
同时 还 能 解决 第 7 条 “j loop” 指 令 的 控制 冒险 ) ;为 解决 数据 骨 险 , 共 需 加 13 或 14 条 nop 指 
令 ,大 大 增加 了 程序 的 长 度 , 并 极 大 地 降低 了 指令 执行 效率 。 数 据 冒 险 在 多 数 情况 下 可 通过 
“转发 ”来 解决 ,此 处 ,第 2、3、4 条 指令 所 需要 的 操作 数 可 通过 “转发 ”得 到 ,无 须 加 nop 指令 。 
第 5 条 指令 所 需要 的 操作 数 $t0 是 Load-use 冒险 ,不 能 用 “转发 ”解决 问题 ,需要 在 第 5 条 
指令 前 加 1 条 nop 指令 ,或 通过 硬件 将 第 5 条 指令 的 执行 阻塞 1 个 时 钟 周期 。 

(3) 对 于 分 支 冒险 , 若 检测 结果 是 否 为 “ 零 ? 并 更 新 PC 的 操作 在 “ 访 存 (Mem)” 阶 段 进 
行 , 则 分 支 延迟 损失 时 间 片 (分 支 延迟 槽 ) 为 3, 此 时 在 第 5 条 分 支 指令 后 加 3 条 nop 指令 ， 
或 从 硬件 上 使 分 支 指令 后 面 一 条 指令 的 执行 阻塞 3 个 时 钟 周期 。 若 检测 结果 是 否 为 “ 零 ”并 
更 新 PC 的 操作 在 “执行 (Ex)” 阶 段 进行 , 则 分 支 延迟 损失 时 间 片 (分 支 延 迟 槽 ) 为 2。 

(4) 假定 j 指令 更 新 PC 的 操作 在 “执行 (Ex)” 阶 段 进行 , 则 流水 线 将 被 阻塞 2 个 时 钟 周 
期 ,此 时 ,需要 在 Jump 指令 后 加 2 条 nop 指令 才能 消除 该 控制 冒险 。 假 定 更 新 PC 的 操作 
在 “ 译 码 (ID)” 阶 段 进行 , 则 流水 线 只 被 阻塞 1 个 时 钟 周期 。 

8. 假定 有 一 个 程序 共 1000 条 指令 ,其 指令 序列 为 “lw, add, lw, add, …”。add 指令 
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， 仅 依赖 它 前 面 的 lw 指令 ,而 lw 指令 也 仅 依赖 它 前 面 的 add 指令 。 寄 存 器 写 口 和 寄存 器 读 
| “ 口 分 别 在 一 个 时 钟 周期 的 前 .后 半 个 周期 内 独立 工作 。 请 回答 下 列 问题 : 
| (1) 在 带 转发 的 5 段 流水 线 中 执行 该 程序 ,其 CPI 为 多 少 ? 

(2) 在 不 带 转发 的 5 段 流 水 线 中 执行 该 程序 ,其 CPI 为 多 少 ? 

【分 析 解答 】 

(1) 车 流水 线 中 有 “转发 " 届 辑 ,并 且 寄存 器 写 口 和 寄存 器 读 口 分 别 在 一 个 时 钟 周期 的 
前 、 后 半 个 周期 内 工作 , 则 只 存在 lw 指令 和 add 指令 之 间 的 一 个 Load-use 数据 骨 险 ,因此 ， 
每 个 lw 指令 和 add 指令 之 间 有 一 次 流水 线 阻 塞 , 即 每 一 对 lw 和 add 指令 需要 用 3 个 时 钟 
周期 完成 ,因而 CPI 为 1.5。 

(2) 若 流水 线 中 没有 “转发 " 迎 辑 ,而 寄存 器 写 口 和 寄存 器 读 口 分 别 在 一 个 时 钟 周 期 的 
前 、 后 半 个 周期 内 工作 , 则 在 每 两 条 相 邻 指令 之 间 都 会 有 两 个 阻塞 ,这 样 每 条 指令 相当 于 都 
要 有 3 个 时 钟 才 能 完成 ,因而 CPI 为 3。 

9. 假定 在 一 个 如 图 7.4 所 示 的 带 “ 转 发 "功能 的 5 段 流水 线 中 执行 以 下 指令 序列 , 则 怎 
样 调整 以 下 指令 序列 才能 使 其 性 能 达到 最 好 ? 


lw $2, 100($6) 
add $2, $2, $3 
lw $5, 200($7) 
$6, $4, $7 
sub $3, $4, $6 
lw $2, 300($8) 
beq $2, $8, Loop 


【分 析 解 答 】 

因为 采用 “转发 ”技术 ,所 以 ,只 要 对 Load-use 数据 冒险 进行 指令 序列 调整 。 从 上 述 指 
令 序列 来 看 ,第 1 和 第 2 条 指令 、 第 6 和 第 7 条 指令 之 间 存 在 Load-use 数据 冒险 ,所 以 ,可 
将 与 第 2 和 第 3 条 指令 无 关 的 第 4 条 指令 插入 第 2 条 指令 之 前 ;将 无 关 的 第 5 条 指令 插入 
第 7 条 指令 之 前 。 调 整 顺序 后 的 指令 序列 如 下 。 


Oow 中 mm N 
包 
[7 
a 


lw $2, 100($6) 
add $6, $4, $7 
add $2, $2, $3 
$5, 200($7) 
lw $2, 300($8) 
sub $3, $4, $6 
beq $2, $8, Loop 


10. 假设 将 分 支 指令 中 的 分 支 比较 操作 放 到 五 段 流水 线 的 “ 译 码 / 取 数 (ID)” 阶 段 进 行 ， 
那么 ,下 列 指令 序列 的 执行 过 程 中 ,哪些 数据 冒险 不 能 通过 “转发 ”技术 解决 ? 
1 lw $1, 100 ($2) 


2 addi $1, $1, 8 
人 beq $1, $3, 10 


wmND 中 
[ee 
3 


毕 令 流 冰 线 
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【分 析 解 答 】 

如 图 7. 8 所 示 ,给 出 的 指令 序列 中 ,第 1 和 第 2 条 指令 之 间 的 Load-use 数据 冒险 不 能 
通过 转发 技术 解决 。 对 于 第 2 和 第 3 条 指令 之 间 的 数据 冒险 ,如 果 分 支 比较 操作 在 “执行 
(Ex)” 阶 段 以 后 进行 , 则 完全 可 以 将 第 2 条 指令 的 执行 结果 (在 Ex/Mem 流水 段 寄 存 器 中 ) 
转发 给 到 执行 (Ex 阶段 的 beq 指令 的 ALU 输入 端 。 但 是 ,如 果 beq 指令 在 ID 阶段 进行 比 
较 操 作 ,因为 在 ID 阶段 的 beq 指令 需要 用 到 $1 的 值 时 ,第 2 条 的 addi 指令 还 没有 将 $1 
的 值 在 ALU 中 计算 出 来 ,因此 来 不 及 转发 ,因而 beq 指令 的 执行 需要 阻塞 一 个 时 钟 周期 ， 
如 图 7. 8 所 示 。 


Time (Clock Cycles) 


ID | Ex 1Mem | Wr 


， 
上 1 1 
上 1 1 
1 1 1 
1 一 1 1 
lw $1, 100($2) | IM Hi Reg 1> Et DM Ree 
十 My 1 
| 中 1 1 
上 1 1 1 
1 1 > 1 
addi $1, $1, 8 '| IM Reg|! >E I DM 
r 1 1 
1 1 1 
上 上 | 
1 1 
上 上 
1 1 
中 上 
上 1 


于 一- 一 一 一- 一 十 - 


1 
1 
1 
1 
1 
| 
1 
1 
1 
1 
1 
| 
1 
1 
1 
DM pH Reg 


beq $1, $3, 10 


| 


0 
1 
1 
| 
图 7.8 题 10 的 图 示 


11. 假设 数据 通路 中 各 主要 功能 部 件 的 操作 时 间 如 下 。 存 储 器 : 200ps; ALU 和 加 法 
器 : 100ps; 寄 存 器 堆 读 口 或 写 口 : 50ps。 程 序 中 指令 的 组 成 比例 为 取 数 25%、 存 数 10%、 
ALU 52%\ 分 支 11%、 跳 转 2% 。 假 设 非 单 周期 处 理 器 时 的 时 钟 周期 取 存 储 器 存 取 时 间 的 
一 半 ,MUX、 控 制 单 元 PC、 扩展 器 和 传输 线路 等 的 延迟 都 忽略 不 计 , 则 下 面 的 实现 方式 中 ， 
哪个 最 快 ? 快 多 少 ? 

(1) 单 周期 方式 : 每 条 指令 在 一 个 固定 长 度 的 时 钟 周期 内 完成 。 

(2) 多 周期 方式 : 每 类 指令 的 时 钟 数 为 取 数 -7, 存 数 -6,ALU-5 ,分 支 -4, 跳 转 -4。 

(3) 流水 线 方 式 : 采用 取 指 1、 取 指 2、 取 数 / 译 码 、 执 行 、 存 取 1、 存 取 2、 写 回 七 段 流水 
线 ; 没 有 结构 冒险 ;数据 冒险 采用 “转发 ”技术 处 理 ;Load 指令 与 后 续 各 指令 之 间 存 在 依赖 关 
系 的 概率 分 别 为 /2、1/4、1/8、… ;分 支 延 迟 损失 时 间 片 为 2, 分 支 预测 准确 率 为 75% ;不 考 
虑 异常 .中 断 和 访 存 缺 失 引 起 的 流水 线 冒 险 。 

【分 析 解 答 】 

(1) 单 周期 方式 下 ,时钟 周 期 为 200 十 50 十 100 十 200 十 50 王 600ps, 故 一 条 指令 的 执行 时 
间 为 600ps。 

(2) 多 周期 方式 下 ,CPI 二 0.25X7 十 0. 10X6 十 0. 52X5 十 0. 11X4 十 0. 02X4==5.47, 因 
为 存储 器 操作 变 为 在 两 个 时 钟 周期 内 完成 ,所 以 多 周期 数据 通路 的 时 钟 周期 为 100ps, 故 平 
均一 条 指令 的 执行 时 间 为 100X5.47 一 547ps。 

(3) 流水 线 方式 下 ,存储 器 操作 变 为 在 两 个 时 钟 周 期 内 完成 后 ,其 流水 线 包 含 了 7 个 阶 
段 。 对 于 分 支 指令 , 若 预 测 正确 , 则 不 需 人 额外 时 钟 周期 , 故 只 需 1 个 时 钟 周期 ;车 预测 错误 ， 
则 因为 分 支 延迟 损失 时 间 片 为 2, 所 以 应 该 将 错误 预 取 的 2 条 指令 冲刷 掉 , 额 外 多 用 了 2 个 
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时 钟 周期 ,因此 预测 错误 时 共 需 3 个 时 钟 周期 , 故 CPI 一 25%X3 十 75% X1= 一 1.5。 对 于 
Load 指令 ,因为 一 个 存储 操作 占用 两 个 时 钟 周期 ,所 以 随后 第 1 条 指令 需 3 个 (其 中 阻塞 2 
个 ) 时 钟 周 期 ;随后 第 二 条 指令 需 2 个 (其 中 阻塞 1 个 ) 时 钟 周期 ,以 后 的 指令 都 不 需要 阻塞 ， 
故 CPI=1/2X3 十 1/4X2 十 2/8X1=2.25。 对 于 ALU 指令 ,随后 的 数据 相关 指令 都 可 通过 
转发 解决 , 故 CPI 二 1; 对 于 Store 指令 ,不 会 发 生 数 据 冒 险 , 故 CPI 二 1; 对 于 Jump 指令 ,最 快 也 


要 在 译 码 阶段 才能 确定 转移 地 址 , 故 CPI 二 3。 因 此 综合 CPI 二 0. 25X2. 
1 十 0. 11X1. 5 十 0. 02X3 二 1.41。 所 以 ,平均 一 条 指令 的 执行 时 间 为 1.4 


25 十 0. 10X1 十 0. 52X 
1X100 王 141ps。 


由 上 述 分 析 可 知 ,流水 线 处 理 器 的 指令 执行 速度 最 快 ,是 单 周 期 的 600/141 一 4. 26 倍 ， 


是 多 周期 的 547/141= 二 3. 84 售 。 


12. 假设 有 一 段 程序 的 核心 模块 中 有 5 条 分 支 指 令 ,该 模块 将 会 被 执行 成 千 上 万 次 ,在 
其 中 一 次 执行 过 程 中 ,5 条 分 支 指令 的 实际 执行 情况 如 下 (T: Taken;N: Not Taken)。 


分 支 指令 1(B1) : T-T-T。 

分 支 指令 2(B2) : N-N-N-N。 

分 支 指令 3(B3) : T-N-T-N-T-N。 
分 支 指令 4(B4) : T-T-T-N-T。 

分 支 指令 5(B5) : T-T-N-T-T-N-T。 


假定 各 个 分 支 指令 在 每 次 模块 执行 过 程 中 实际 执行 情况 都 一 样 , 并 且 动态 预测 时 ,每 个 
分 支 指令 都 有 各 自 的 预测 表 项 ,每 次 执行 时 的 初始 预测 位 都 相同 。 请 给 出 以 下 几 种 预测 方 


案 的 预测 准确 率 。 

(1) 静态 预测 ,总 是 预测 转移 〈Taken) 。 

(2) 静态 预测 ,总 是 预测 不 转移 (Not Taken) 。 

(3) 一 位 动态 预测 ,初始 预测 转移 〈Taken) 。 

(4) 二 位 动态 预测 ,初始 预测 弱 转 移 (Taken) 。 

【分 析 解 答 】 

预测 准确 率 二 预测 正确 次 数 /总 预测 次 数 X100%。 以 下 R 表示 了 
错误 预测 次 数 。 


E 确 预测 次 数 , W 表示 


(1) B1:R-3,W-0; B2:R-0,W-4; B3:R-3,W-3; B4:R-4,W-1; B5:R-5, W-2; 60%。 
(2) B1:R-0,W-3; B2:R-4,W-0; B3:R-3,W-3; B4:R-1,W-4; B5:R-2,W-5; 40%%。 
(3) B1:R-3,W-0; B2:R-3,W-1; B3:R-1,W-5; B4:R-3,W-2; B5:R-3, W-4; 52%。 
(4) B1:R-3,W-0; B2:R-3,W-1; B3:R-3,W-3; B4:R-4,W-1; B5:R-5,W-2; 72%。 


13. 对 于 以 下 MIPS 指令 序列 : 


Loop: lw $2, 100($6) 
add $3, $2, $7 
sw $3, 100($6) 
lw $5, 200($6) 
sub $4, $5, $2 
sw $4, 300($€) 
addi $6, $6, 8 
bne $6, $8, Loop 


医 令 流光 线 


假定 在 一 个 如 图 7.4 所 示 的 采用 “转发 ”技术 的 五 段 流 水 线 中 执行 上 述 循环 50 次 ,该 流 
水 线 数据 通路 中 ,寄存 器 写 口 和 寄存 器 读 口 分 别 被 安排 在 一 个 时 钟 周期 的 前 、 后 半 个 周期 内 
独立 工作 ,分 支 指令 的 分 支 延 迟 损失 时 间 片 为 3。 要求 回答 下 列 问题 : 

(1) 不 采用 分 支 预测 时 ,每 次 循环 执行 需要 多 少时 钟 周期 ? 

(2) 若 采用 静态 分 支 预测 ,并 总 是 预测 转移 (Taken), 则 各 次 循环 执行 需要 多 少时 钟 周 
期 ? 总 的 执行 时 间 比 不 采用 分 支 预测 时 快 多 少 ? 

(3) 如 何 调整 指令 顺序 使 得 指令 序列 执行 时 流水 线 的 阻塞 次 数 最 少 ? 在 不 采用 分 支 预 
测 的 情况 下 ,指令 顺序 调整 后 总 的 执行 时 间 少 多 少 ? 在 采用 静态 预测 (总 是 预测 转移 ) 的 情 
况 下 ,指令 顺序 调整 后 总 的 执行 时 间 少 多 少 ? 

【分 析 解 答 】 

(1) 循环 中 有 2 个 Load-use 冒险 和 一 个 控制 (分 支 ) 冒 险 ,因为 分 支 指令 的 分 支 延迟 损 
失 时 间 片 为 3, 所 以 共有 2 十 3 二 5 次 阻塞 ,因而 每 次 循环 的 执行 共 需 8 十 5 二 13 个 时 钟 周期 。 

(2) 若 采用 静态 分 支 预测 ,并 总 是 预测 转移 , 则 前 面 49 次 循环 中 的 分 支 预测 都 能 成 功 ， 
每 次 循环 需 8 十 2 二 10 个 时 钟 周期 ,最 后 1 次 循环 中 的 分 支 预测 不 成 功 ,需要 在 流水 线 中 冲 
刷 掉 3 条 指令 ,因而 最 后 一 次 循环 需 8 十 ?十 3 一 13 个 时 钟 周期 。 这 种 情况 下 ,总 的 执行 时 间 
为 (5 一 1) 十 49X10 十 1X13=507 个 时 钟 周期 。 不 采用 分 支 预测 时 总 的 执行 时 间 为 
(5 一 1) 十 50X13 王 654 个 时 钟 周期 。 所 以 两 者 相 比 ,采用 静态 预测 比 不 采用 分 支 预测 时 少 
用 了 654 一 507 二 147 个 时 钟 周期 。 

《3) 可 以 将 无 关 指 令 插 人 到 Load-use 数据 相关 指令 之 间 ,调整 指令 顺序 后 的 指令 序列 
如 下 。 


Loop: lw $2, 100($6) 
lw $5, 200($6) 
add $3, $2, $7 
Sw $3, 100($6) 
Sub $4, $5, $2 
Sw $4, 300($6) 
addi $6, $6, 8 
bne $6, $8, Loop 


指令 顺序 调整 后 ,消除 了 Load-use 数据 冒险 ,因而 ,在 不 采用 分 支 预 测 的 情况 下 ,每 次 
循环 需 8 十 3 二 11 个 时 钟 周期 , 共 (5 一 1) 十 11X50=554 个 时 钟 周期 。 比 调整 指令 顺序 前 少 
了 654 一 554 一 100 个 时 钟 周期 。 

指令 顺序 调整 后 ,在 采用 静态 预测 (总 是 预测 转移 ) 的 情况 下 ,前 49 次 每 次 循环 需 8 个 
时 钟 周期 ,最 后 1 次 预测 错误 , 需 在 流水 线 中 冲刷 3 条 指令 ,因而 需 8 十 3=11 个 时 钟 周期 ， 
共和 需 (5 一 1) 十 49X8 十 1X11 王 407 个 时 钟 周期 ,与 调整 指令 顺序 前 相 比 ,总 的 执行 时 间 少 了 
507 一 407 王 100 个 时 钟 周期 。 

如 果 将 指令 序列 优化 并 采用 分 支 预测 的 情况 与 未 进行 指令 序列 优化 且 未 采用 分 支 预测 
的 情况 相 比 , 则 总 的 执行 时 间 少 了 654 一 407 一 247 个 时 钟 周期 。 

14. 某 高 级 语言 源 程 序 中 的 一 个 while 语句 为 “while (save[i] 二 二 k ) i 十 二 1;”, 若 对 
其 编译 时 ,编译 器 将 i 和 上 分 别 分 配 在 寄存 器 $s3 和 $s5 中 ,数组 save 的 基 址 存放 在 $s6 
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中 , 则 生成 的 MIPS 汇编 代码 段 如 下 。 


1 lo0p:- all ‘S$tly $3 2 #R[IS$t1]<R[$s3]<<2, 妇 MRIS$t1]=iX4 

有 add S$tl, $t1l, $s6 #RISt1]<-RISt1]+R[$s6], 妈 RIS$t1]=Address of save[i] 
| lw S$t0, 0($t1) #R[S$t0]<-MIR[$t1]+0] ,BB RIS$t0]=save [i] 

4 bne $t0, $s5, exit #if RI$t0] 也 R[$s5] then goto exit 

5 addi $s3, $s3, 1 #R[$s3]<R[I$s3]+1, 即 i=i+1 

6 村 loop #goto loop 

7 exit;: 


假定 如 图 7. 1 所 示 流 水 线 数据 通路 中 各 主要 功能 单元 的 操作 时 间 如 下 。 存 储 器 ， 
200ps;ALU 和 加 法 器 :100ps; 寄 存 器 堆 ( 读 或 写 ) :50ps。 请 回答 下 列 问题 : 

(1) 在 不 考虑 流水 段 寄存 器 、 多 路 选择 器 、 控 制 单元 PC、 扩展 器 和 线路 等 延迟 的 情况 
下 ,五 段 流 水 线 处 理 器 的 最 小 时 钟 周期 为 多 少 ? 

(2) 请 指出 循环 体 中 指令 之 间 的 数据 相关 性 。 

《3) 假定 采用 “转发 ”技术 ,并 对 分 支 冒险 采用 “一 位 动态 预测 ”初始 预测 为 转移 ) 方 式 ， 
条 件 检 测 和 分 支 目 标 地 址 修改 都 在 “执行 (Ex)” 阶 段 进行 ,Jump 指令 在 “ 译 码 (ID)” 阶 段 进 
行 跳 转 目标 地 址 修改 , 则 在 流水 线 处 理 器 上 执行 8 次 循环 所 用 的 时 间 为 多 少 纳 秒 ? 对 于 同 
样 的 8 次 循环 执行 ,与 第 6 章 的 6.6 节 分 析 应 用 题 16 中 的 单 周期 和 多 周期 处 理 器 相 比 , 流 
水 线 处 理 器 的 速度 快 了 多 少 倍 ? 

【分 析 解 答 】 

(1) 因为 最 复杂 的 部 件 ( 存 储 器 ) 所 用 的 最 长 时 间 为 200ps, 所 以 ,在 不 考虑 流水 段 寄存 
器 、 多 路 选择 器 、 控 制 单元 .PC、 扩 展 器 和 线路 等 延迟 的 情况 下 ,五 段 流水 线 处 理 器 的 最 小 时 
钟 周期 为 200ps。 

《2) 循环 体 中 第 1 和 第 2、 第 2 和 第 3、 第 3 和 第 4、 第 5 和 第 1 条 指令 之 间 存 在 数据 
相关 。 

(3) 采用 “转发 ”技术 可 以 消除 第 1 和 第 2、 第 2 和 第 3、 第 5 和 第 1 条 指令 之 间 的 数据 
相关 ,但 不 能 消除 第 3 和 第 4 条 指令 之 间 的 Load-use 冒险 ,8 次 循环 共有 8 个 时 钟 的 阻 
塞 ; 此 外 ,对 于 bne 控制 (分 支 ) 冒 险 ,第 1 次 和 最 后 1 次 预测 错误 ,所 以 有 2 次 需要 对 预 取 
执行 的 指令 进行 冲刷 。 因 为 条 件 检测 和 转移 目标 地 址 修改 都 在 “执行 (Ex)” 阶 段 进 行 , 因 
此 ,分 支 延迟 损失 时 间 片 (分 支 延迟 槽 ) 为 2, 即 每 次 冲刷 掉 2 条 指令 。 因 此 ,2 次 共 被 冲 
刷 掉 4 条 指令 ,使 流水 线 阻塞 了 4 个 时 钟 周 期 ;对 于 最 后 一 条 Jump 指令 ,因为 在 “ 译 码 
(ID) ”阶段 进行 跳 转 目 标 地 址 修改 ,所 以 每 次 有 一 个 时 钟 阻 塞 ,8 次 循环 Jump 指令 共 执 行 
了 7 次 ,因而 有 ?7 个 时 钟 周期 的 阻塞 。 综 上 可 知 ,8 次 循环 总 共有 8 十 4 十 7 二 19 次 阻塞 ， 
且 第 1~4 条 指令 各 执行 了 8 次 ,第 5~6 条 指令 各 执行 了 7 次 ,因此 ,8 次 循环 所 用 的 时 
钟 周 期 数 为 (5 一 1) 十 4X8 十 2X7 十 19 一 69 ,总 共 时 间 为 69 X200ps 一 13. 8ns。 

与 第 6 章 的 6.6 节 分 析 应 用 题 16 的 单 周 期 处 理 器 相 比 ,该 流水 线 处 理 器 执行 上 述 程序 
段 的 速度 快 了 (27. 6 一 13. 8)/13. 8 一 1 倍 ;与 第 6 章 的 6.6 节 分 析 应 用 题 16 的 多 周期 处 理 
器 相 比 , 快 了 (35. 4 一 13. 8)/13. 8 二 1.57 售 。 


第 章 
—8 系统 总 线 


8.1 教学 目标 和 内 容 安排 


主要 教学 目标 : 

使 学 生 掌 握 现 代 计 算 机 中 各 主要 模块 之 间 的 总 线 互 连 方式 。 包 括 总 线 基 本 概念 、 总 线 
的 分 类 、 总 线 的 组 成 及 性 能 指标 、 总 线 的 裁决 、 总 线 的 定时 方式 、 总 线 标准 及 其 现代 计算 机 的 
总 线 互 连 结构 。 

基本 学 习 要 求 : 

(1) 了 解 总 线 的 作用 和 组 成 。 

(2) 了 解 总 线 的 不 同 分 类 。 

(3) 理解 总 线 各 项 性 能 指标 的 含义 。 

(4) 理解 为 什么 要 采用 总 线 标准 。 

(5) 理解 计算 机 如 何 通 过 总 线 连 接 各 功能 部 件 。 

(6) 理解 总 线 如 何 确定 总 线 控制 权 。 

(7) 理解 总 线 上 的 操作 如 何 定 时 。 

(8) 了 解 常 用 的 几 类 总 线 标准 。 

(9) 了 解 典 型 的 多 总 线 结构 框架 。 


本 章 着 重 介 绍 在 计算 机 主要 部 件 (CPU 存储 器 和 I/O 接口 ) 之 间 进 行 连接 的 系统 总 线 
所 涉及 的 概念 和 知识 体系 。 在 此 之 前 ,学 生 已 经 对 指令 的 执行 .存储 器 的 层次 结构 .CPU 设 
计 等 方面 的 内 容 有 所 了 解 , 因 此 ,在 本 章 开 头 , 可 以 从 指令 执行 过 程 中 涉及 的 部 件 之 间 的 数 
据 交换 开始 讲 起 ,将 总 线 和 指令 执行 过 程 、 总 线 和 CPU、cache、 存 储 器 、 显 卡 等 IO 接口 联 
系 起 来 ,说 明 指令 执行 过 程 中 可 能 需要 在 哪些 部 件 之 间 进 行 数据 交换 ,以 及 在 每 次 数据 交换 
过 程 中 ,在 部 件 之 间 需 要 传送 哪些 信息 ,并 说 明 传送 这 些 信 息 的 任务 就 是 由 总 线 完成 的 。 这 
样 , 既 复 习 了 所 学 的 概念 和 知识 ,又 将 相关 内 容 串 接 了 起 来 ,并 且 , 使 得 学 生 在 学 习 具 体 的 有 
关 总 线 设 计 的 内 容 之 前 ,对 总 线 的 组 成 .职责 和 总 线 在 计算 机 中 的 位 置 有 较为 全 面 的 了 解 ， 
从 而 有 利于 学 生 对 相关 总 线 设 计 内 容 的 理解 。 

在 课时 有 限 的 情况 下 ,本章 中 的 几 种 分 布 式 裁 决 方式 分 离 事务 方式 的 细节 \ 总 线 接 口 
单元 的 基本 功能 ,以 及 几 个 具体 的 总 线 标准 都 可 以 跳 过 不 讲 , 但 是 ,这 些 细节 内 容 ( 如 PCI 
总 线 标准 ) 对 主要 概念 的 理解 是 非常 有 用 的 ,可 以 要 求学 生 在 课 后 自己 阅读 这 些 内 容 ,其 阅 


计算 夫 组 成 与 系统 结 欧 习 症 解答 与 才学 指导 


读 的 目的 不 是 要 学 生 去 记 住 具体 的 实现 细节 ,而 是 通过 对 具体 实现 细节 的 了 解 来 强化 对 基 
本 原理 的 理解 。 


8.2 主要 内 容 提要 


1， 总 线 的 概念 和 分 类 

总 线 是 计算 机 系统 中 部 件 或 设备 之 问 传送 信息 的 公共 通路 ,包括 传输 介质 和 相应 的 控 
制 逻 辑 。 根 据 总 线 所 在 位 置 , 可 以 分 为 内 部 总 线 、 系 统 总 线 和 通信 和 总线 3 类 。 内 部 总 线 指 芯 
片 内 部 连接 各 元 件 的 总 线 , 如 CPU 内 部 总 线 。 系 统 总 线 指 在 计算 机 的 主要 功能 部 件 
(CCPU、 主 存 .O 接口 ) 之 间 传 送信 息 的 总 线 , 由 数据 线 、 地 址 线 和 控制 线 组 成 。 根 据 所 处 位 
置 和 功能 的 不 同 ,系统 总 线 又 可 分 为 处 理 器 总 线 、 存 储 器 总 线 和 I/O 总线。 通常 处 理 器 总 
线 和 存储 器 总 线 是 专用 总 线 , 而 I/O 总 线 是 标准 总 线 , 如 PCI 总 线 .AGP 总 线 .PCI-Express 
总 线 等 。 通 信 总 线 指 用 于 主机 和 I/O 设备 之 间或 计算 机 系统 之 间 通 信和 的 总线 ,如 RS-232 
串 行 总 线 、USB 串 行 总 线 、SCSI 总 线 等 。 

2. 总 线 带 宽 

指 总 线 的 最 大 数据 传输 率 , 即 在 数据 传输 阶段 单位 时 间 内 总 线 上 可 传输 的 数据 量 。 它 
与 总 线 位 宽 、 总 线 时 钟 频率 和 传送 每 个 数据 所 需要 的 时 钟 周期 数 有 关 。 

3， 总 线 事务 类 型 

指 在 总 线 上 进行 的 不 同 信息 传输 类 型 ,如 存储 器 读 、 存 储 器 写 .IO 读 、I/O 写 、 中 断 响 
应 等 。 有 些 总 线 事 务 要 求 完 成 一 连 串 连续 单元 的 读 写 , 如 从 存储 器 读 一 个 cache 行 或 写 一 
个 cache 行 到 主 存 , 这 种 情况 下 ,一 个 总 线 事务 能 完成 多 个 数据 的 读 写 , 称 为 突 发 (Burst) 传 
输 方式 。 

4. 总 线 裁决 方式 

在 多 个 主 控 设备 都 要 求 使 用 总 线 时 ,需要 进行 总 线 裁决 ,有 和 集中 式 裁决 和 分 布 式 裁决 
两 类 。 

集中 式 裁决 由 专门 的 总 线 裁 决 器 来 集中 确定 总 线 使 用 权 。 集 中 式 裁决 主要 有 链 式 查 
诊 、 计 数 器 定时 查询 和 独立 请 求 方式 。 链 式 查询 方式 下 ,总 线 允 许 信号 在 设备 问 用 菊花 链 串 
联 起 来 , 按 顺 序 查 询 ,接口 简单 ;计数 器 定时 查询 方式 下 ,通过 计数 值 确定 查询 顺序 ,优先 级 
比 链 式 查询 灵活 ,能 保证 公平 性 :独立 请 求 方式 下 ,每 个 设备 有 独立 的 总 线 请 求 线 ,优先 级 可 
编程 设置 ,裁决 速度 快 。 

分 布 式 裁决 没有 专门 的 总 线 裁决 器 ,裁决 逻辑 分 散在 每 个 设备 的 总 线 接口 中 。 分 布 式 
裁决 主要 有 有 自 举 分 布 、 冲 突 检 测 和 并 行 竞争 方式 。 自 举 分 布 方 式 下 ,每 个 设备 只 有 在 查看 到 
所 有 优先 级 比 自己 高 的 设备 没有 请 求 时 才能 使 用 总 线 ; 冲突 检测 方式 下 ,设备 直接 使 用 总 
线 , 使 用 过 程 中 侦 听 到 有 其 他 设备 也 在 使 用 总 线 时 , 则 释放 总 线 ,然后 在 一 个 随机 时 间 段 后 
再 次 使 用 总 线 ; 并 行 竞争 方式 下 ,每 个 设备 接口 中 有 专门 的 仲裁 逻辑 ,能 保证 送 到 数据 线 上 
的 多 个 仲裁 号 (设备 号 ) 中 只 有 最 大 的 仲裁 号 的 信息 保留 在 数据 线 上 ,以 取得 总 线 使 用 权 。 

5. 总 线 定 时 方式 

在 总 线 上 通信 的 两 个 设备 必须 知道 对 方 何 时 传送 什么 信息 ,因此 双方 需要 有 相应 的 通 
信 协 议 ,以 确定 如 何 交换 信息 ,这 就 是 定时 方式 的 确定 。 最 基本 的 定时 方式 有 同步 和 异步 两 
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种 ,在 这 两 种 基本 定时 方式 基础 上 ,又 派生 出 半 同 步 和 分 离 事 务 两 种 定时 方式 。 同 步 方式 用 
一 个 公共 的 时 钟 信号 对 传输 过 程 的 每 个 步骤 进行 同步 控制 ;异步 方式 用 异步 应 答 ( 握 手 ) 信 
号 对 传输 过 程 的 每 个 步骤 进行 定时 控制 ; 半 同 步 方式 将 同步 和 异步 方式 结合 起 来 进行 定时 ， 
即 在 时 钟 信号 的 同步 控制 下 发 出 和 采样 异步 应 答 信号 ;分 离 事 务 方式 把 传输 过 程 分 成 两 个 
阶段 ,使 得 从 设备 在 准备 数据 时 总 线 被 释放 给 其 他 设备 使 用 。 

6， 总线 标准 

总 线 标准 化 以 后 ,使 得 在 计算 机 中 增删 设备 非常 容易 ,提高 了 设备 的 兼容 性 和 互 换 性 。 
因此 ,I/O 总 线 和 通信 和 总 线 大 多 是 标准 化 总 线 。 曾 经 流行 或 正在 被 广泛 使 用 的 I/O 总 线 标 
准 有 ISA、EISA、PCI、APG、PCI-Express 等 。 

7， 总线 结构 

随 着 计算 机 系统 中 相互 连接 的 部 件 或 设备 种 类 的 增加 ,用 于 连接 部 件 和 设备 的 系统 总 
线 的 数量 也 越 来 越 多 。 计 算 机 连接 结构 从 早期 的 单 总 线 结构 发 展 到 现在 的 多 总 线 结构 。 单 
总 线 结构 中 ,所 有 主要 功能 部 件 ( 如 CPU、 主 存 和 各 I/O 接口 模块 ) 都 挂 接 在 一 个 总 线 上 。 
双 总 线 结构 中 ,CPU、 主 存 .I/O 接口 之 间 分 别 互 连 , 以 形成 不 同 的 总 线 。 如 CPU 和 主 存 之 
间 用 处 理 器 - 主 存 总 线 ;CPU 和 I/O 接口 模块 之 间 用 IO 总 线 ;CPU、 主 存 和 IOP 之 间 用 主 
存 总 线 ; 各 I/O 接口 模块 和 IOP 之 间 用 1/O 总 线 ; 等 等 。 多 总 线 结构 将 不 同 速度 的 部 件 细 
分 后 再 分 级 互 连 ,总 线 和 总 线 之 间 用 桥接 器 相连 ,以 形成 多 总 线 结构 。 如 cache 和 CPU 之 
间 单 独 用 局 部 总 线 相连 ;处 理 器 总 线 和 存储 器 总 线 之 间 加 一 个 桥接 器 ,分 别 与 处 理 器 和 存储 
器 相连 ;将 高 速 I/O 设备 和 低速 IO 设备 分 离 ,分 别 用 高 速 I/O 总 线 和 慢 速 IO 总 线 相连 。 


8.3 ”基本 术语 解释 


总 线 (Bus) 

总 线 是 共享 的 信息 传输 介质 ,用 于 连接 若干 设备 ,由 一 组 传输 线 组 成 ,信息 通过 这 组 传 
输 线 在 设备 之 间 被 传送 。 总 线 按 其 所 在 的 位 置 ,分 为 片 内 总 线 、 系 统 总 线 和 通信 和 总线。 

片 内 总 线 (Internal Bus) 

片 内 总 线 指 芯片 内 部 连接 各 元 件 的 总 线 。 例 如 ,在 CPU 芯片 内 部 ,存在 连接 各 个 寄存 
器 、ALU、 多 路 选择 器 等 各 元 件 的 总 线 。 

系统 总 线 (System Bus) 

系统 总 线 是 用 来 连接 计算 机 硬件 系统 中 若干 主要 部 件 ( 如 CPU、 主 存 .1/O 模块 ) 的 总 
线 。 系 统 总 线 上 传输 的 有 数据 、 地 址 和 控制 信息 ,因此 系统 总 线 中 包含 3 组 传输 线 : 数据 
线 、 地 址 线 和 控制 线 , 有 时 也 把 它们 分 别称 为 数据 总 线 、 地 址 总 线 和 控制 总 线 。 根 据 总 线 所 
在 的 位 置 , 系 统 总 线 可 分 为 处 理 器 总 线 、 存 储 器 总 线 和 IO 总 线 。( 注 : Intel 公司 推出 的 芯 
片 组 中 ,对 系统 总 线 赋予 了 特定 的 含义 ,把 CPU 连接 到 北桥 芯片 的 总 线 称 为 系统 总 线 ,也 
称 为 处 理 器 总 线 ,或 称 为 前 端 总 线 (Front Side Bus,FSB) 。CPU 通过 前 端 总 线 连接 到 北桥 
芯片 ,进而 通过 北桥 芯片 和 内 存 、 显 卡 交换 数据 ) 

处 理 器 一 存储 器 总 线 (Processor-memory Bus) 

把 专门 用 来 连接 处 理 器 和 主 存 的 总 线 称 为 处 理 器 一 存储 器 总 线 。 这 种 总 线 不 是 通用 的 
标准 总 线 , 而 是 按 机 器 定制 的 专用 总 线 。 这 类 总 线 长 度 短 ,速度 快 。 其 性 能 指标 是 主板 的 最 
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重要 性 能 指标 之 一 。 

如 果 在 处 理 器 和 主 存 之 间 有 一 个 中 间 部 件 ( 通 常 为 桥接 器 ) ,那么 处 理 器 一 存储 器 总 线 
被 分 成 处 理 器 总 线 和 存储 器 总 线 。 例 如 ,在 Intel 公司 推出 的 芯片 组 中 ,因为 在 CPU 和 主 存 
之 间 有 一 个 北桥 芯片 组 ,所 以 ,处 理 器 一 存储 器 总 线 被 分 成 了 两 个 总 线 : 把 CPU 连接 到 北 
桥 芯片 的 总 线 称 为 处 理 器 总 线 ,也 称 为 系统 总 线 或 前 端 总 线 , 把 北桥 芯片 连 到 主 存 的 总 线 称 
为 存储 器 总 线 。 所 以 ,CPU 通过 前 端 总 线 (FSB) 连 接 到 北桥 芯片 ,进而 通过 存储 器 总 线 , 再 
连 到 内 存 ; 男 外 ,从 北桥 通过 AGP 总 线 或 PCI-Express 总 线 可 以 连 到 显示 卡 , 以 便 和 显示 卡 
交换 数据 。 

I/O 总 线 (1/O Bus) 

用 于 各 种 外 设 控制 器 ( 即 IO 接口 ,如 显卡 、 网 卡 等 ) 与 主机 相连 ,通常 是 标准 总 线 ,如 
PCI 总 线 、AGP 总 线 .PCI-Express 总 线 等 。 

通信 总 线 (Communication Bus) 

通信 总 线 用 于 主机 和 I/O 设备 之 间或 计算 机 系统 之 间 的 通信 。 由 于 这 类 连接 涉及 各 
类 不 同 设备 ,其 距离 远近 、 速 度 快慢 、 工 作 方式 等 差异 很 大 ,所 以 通信 总 线 的 种 类 很 多 。 如 
RS-232 串 行 总 线 \USB 串 行 总 线 、SCSI 总 线 等 。 

底板 总 线 (Backplane Bus) 

总 线 按 连 线 类 型 可 分 为 电缆 式 、 主 板式 和 底板 式 。 通 常 ,通信 总 线 采 用 电缆 式 总 线形 
式 , 处 理 器 一 存储 器 总 线 采用 主板 式 总 线形 式 , 而 I/O 总 线 采 用 底板 式 总 线形 式 。 

底板 式 总 线 在 主板 上 提供 相应 的 总 线 插 槽 ,各 种 IO 接口 模块 (如 网 卡 、 显 卡 等 ) 以 I/O 插 
件 板 卡 的 形式 插 人 相应 的 插 槽 , 即 可 通过 总 线 完成 信息 的 交换 。 为 使 各 IO 插件 板 的 插座 之 
间 具 有 通用 性 ,底板 总 线 通 常 是 标准 总 线 , 使 得 不 同 厂家 的 W/O 插件 板 可 以 互 连 、 互 换 。 

并 行 总 线 (Parallel Bus) 

并 行 总 线 的 数据 在 数据 线 上 同时 有 多 位 一 起 传送 ,每 一 位 要 有 一 根 数据 线 , 因 此 由 多 根 
数据 线 组 成 。 其 特点 是 同时 可 以 传输 多 位 数据 ,但 数位 之 间 必 须要 同步 。 并 行 总 线 因为 数 
据 线 多 ,使 得 相互 间 干 扰 大 ,因而 ,数据 传输 的 速度 受到 很 大 影响 。 

串 行 总 线 (CSerial Bus) 

串 行 总 线 的 数据 在 数据 线 上 按 位 进行 传输 ,因此 只 需要 一 根 或 两 根 数据 信号 线 ,线路 的 
成 本 低 ,适合 远 距 离 的 数据 传输 。 此 外 ,提高 时 钟 速度 比 并 行 连接 容易 得 多 , 且 几 乎 没有 线 
间 串 扰 , 因 而 串 行 总 线 的 速度 可 以 比 并 行 总 线 快 得 多 。 

信和 号 线 复 用 (Signal Multiplexing) 

信和 号 线 复 用 指 同一 组 线 在 不 同 的 时 刻 传 送 不 同 的 信号 ,如 数据 /地 址 线 复 用 时 ,用 一 组 
线 在 总 线 事 务 的 地 址 阶段 传送 地 址 信息 ,在 数据 阶段 传送 数据 信息 ,这 样 就 使 得 地 址 和 数据 
通过 同一 组 线 进 行 传输 。 

总 线 宽度 (Bus Width) 

总 线 中 数据 线 的 条 数 被 称 为 总 线 的 宽度 , 它 决 定 了 每 次 能 同时 传输 的 数据 信息 的 位 数 。 
用 位 表示 时 ,也 称 为 总 线 位 宽 ; 用 字 节 表示 时 ,其 值 为 总 线 位 宽 除 以 8。 

总 线 时 钟 频率 (Bus Clock Frequency) 

总 线 中 用 于 定时 的 公共 时 钟 信号 的 频率 就 是 总 线 的 时 钟 频率 。 常 以 MHz、GHz 等 为 
单位 。 这 里 M 和 G 都 是 10 的 寡 次 。 


总 线 事 务 (Bus Transaction) 

通常 把 在 总 线 上 一 对 设备 之 间 的 一 次 信息 交换 过 程 称 为 一 个 “总 线 事务 ”。 把 发 出 事务 
请 求 的 部 件 称 为 主 控 设 备 或 主 设备 (Master) ,也 称 起 动 者 (Initiator), 另 一 个 部 件 称 为 从 设 
备 (Slave) ,也 称 目标 (Target) 。 总 线 事务 类 型 由 其 操作 性质 来 定义 。 例 如 ,一 个 “存储 器 
读 ” 事 务 是 指 将 数据 从 主 存 取出 到 处 理 器 ,一 个 “存储 器 写 ? 事 务 是 指 将 数据 写 到 主 存 。 典 型 
的 总 线 事务 类 型 有 “存储 器 读 ”、“ 存 储 器 写 ”、“I/O 读 ”“I/O 写 ”、“ 中 断 响应 ”等 。 

主 控 设 备 (Master, Initiator ) 

发 起 总 线 请 求 并 在 获得 总 线 使 用 权 后 能 控制 总 线 的 设备 。 如 CPU、DMA 控制 器 等 都 
可 以 用 作 主 控 设备 。 

从 设备 (Slave,Target) 

不 能 发 出 总 线 请 求 信号 ,对 总 线 没有 控制 能 力 的 设备 , 它 只 能 响应 从 主 控 设备 发 来 的 总 
线 命 令 。 例 如 , 主 存 通常 只 能 是 从 设备 。 

总 线 传输 周期 (Bus Transmission Cycle) 

指 总 线 上 完成 一 次 总 线 事务 所 用 的 时 间 ,通常 它 由 若干 个 总 线 时 钟 周期 组 成 ,简称 为 总 
线 周期 。 

总 线 带宽 (Bus Bandwidth)》 

总 线 的 带宽 就 是 总 线 的 最 大 数据 传输 率 , 即 总 线 在 进行 数据 传输 时 单位 时 间 内 在 总 线 
上 可 传输 的 最 大 数据 量 。 它 与 总 线 宽度 总线 时 钟 频 率 等 有 关 。 用 公式 表示 为 总 线 带 宽 
B= 二 WXF/N ( 式 中 W 为 总 线 宽度 ,F 为 总 线 时 钟 工作 频率 ,N 为 传输 一 个 数据 所 用 的 总 线 
时 钟 周期 数 ) 。 

突 发 传送 方式 (Burst Transmission) 

是 一 种 连续 的 、 成 批 数据 传送 方式 。 只 需 在 传送 开始 时 给 出 数据 块 的 首 地 址 ,然后 连续 
传送 多 个 数据 ,后 续 数据 的 地 址 被 默认 为 前 面 数据 地 址 加 1, 实际 上 这 些 连续 的 数据 一 般 在 
存储 阵列 的 同一 行 上 。 在 存储 器 中 有 一 个 行 缓冲 ,一 次 读 出 一 行 数据 ,后 面 的 连续 数据 只 要 
从 行 缓冲 中 源源 不 断 地 取出 即 可 。 所 以 ,这 种 方式 能 够 实现 一 个 时 钟 传送 一 个 或 两 个 数据 ， 
在 总 线 宽度 和 工作 频率 相同 的 情况 下 ,数据 传输 率 大 大 高 于 不 支持 突 发 传送 的 总 线 。 这 种 
方式 也 称 为 背 对 背 (Back-to-Back) 传 送 方式 。 

总 线 裁决 (Bus Arbitration) 

决定 哪个 总 线 主 控 设 备 将 在 下 次 得 到 总 线 使 用 权 的 过 程 被 称 为 总 线 裁决 。 进 行 总 线 裁 
决 有 多 种 方案 ,主要 分 为 集中 式 和 分 布 式 两 大 类 。 

总 线 裁决 器 (Bus Arbiter) 

总 线 裁 决 器 也 叫 总 线 控制 器 , 当 多 个 设备 同时 请 求 使 用 总 线 时 ,需要 通过 总 线 裁决 器 决 
定 由 哪个 设备 控制 总 线 。 

总 线 请 求 信 号 (Bus Request Signal) 

一 种 控制 信号 ,设备 要 求 使 用 总 线 时 发 出 ,用 于 表明 发 出 该 请 求 信号 的 设备 需要 使 用 
总 线 。 

总 线 响 应 /允许 信号 (Bus Acknowledge/Bus Grant Signal) 

一 种 控制 信号 ,总 线 控制 器 在 接受 到 设备 的 总 线 请 求 后 ,根据 优先 级 选择 一 个 设备 发 送 
总 线 响应 信和 号 ,表示 允许 该 设备 在 下 一 个 总 线 周期 使 用 总 线 。 
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集中 裁决 (Centralized Arbitration) 

集中 裁决 方式 将 总 线 控制 逻辑 做 在 一 个 专门 的 总 线 控制 器 或 总 线 裁决 器 中 ,通过 将 所 
有 的 总 线 请 求 集中 起 来 利用 一 个 特定 的 裁决 算法 进行 裁决 。 

分 布 裁决 (Distributed Arbitration) 

分 布 裁决 方式 没有 专门 的 总 线 控制 器 ,其 控制 逻辑 分 散在 各 个 总 线 部 件 或 设备 中 。 

同步 总 线 (Synchronous Bus) 

各 部 件 采用 统一 的 时 钟 信号 进行 同步 ,协议 简单 ,因而 速度 快 ,接口 逻辑 很 少 。 但 总 
线 上 的 每 个 部 件 必须 在 规定 的 时 间 内 完成 要 求 的 动作 ,因此 一 般 按 最 慢 的 部 件 来 设计 公 
共 时 钟 。 由 于 时 钟 偏 移 问 题 ,同步 总 线 不 能 很 长 。 所 以 ,一 般 同步 总 线 用 在 部 件 之 间距 
离 短 、 存 取 速 度 较 一 致 的 场合 。 例 如 : CPU 片 内 总 线 、 处 理 器 一 存储 器 总 线 大 都 采用 同 
步 方式 。 

异步 总 线 (Asynchronous Bus) 

异步 总 线 中 没有 时 钟 信 号 线 , 每 一 步 操 作 不 靠 时 钟 定时 。 为 了 协调 异步 总 线 在 发 送 和 
接收 者 之 间 的 数据 传送 ,异步 总 线 使 用 一 种 握手 协议 (应 答 信号 ?进行 通信 。 人 允许 各 设备 之 
间 的 速度 有 较 大 的 差异 ,所 以 异步 总 线 大 多 用 于 具有 不 同 存 取 速 度 的 设备 之 间 进 行 通信 。 
通常 ,异步 方式 被 通信 总 线 采 用 。 

握手 信号 (Handshaking Signal) 

握手 协议 由 一 系列 步 又 组 成 ,在 每 一 步 中 ,只 有 当 双 方 都 同意 时 ,发 送 者 或 接收 者 才 会 
进入 下 一 步 , 协 议 是 通过 一 组 附加 的 控制 线 来 实现 的 。 握 手 协 议 中 的 信号 被 称 为 握手 信号 
或 应 答 信号 。 

半 同 步 总 线 (Semi-Synchronous Bus) 

半 同 步 通信 总 线 既 保留 了 同步 通信 的 特点 ,又 能 采用 异步 应 答 方 式 连接 速度 相差 较 大 
的 设备 。 通 过 在 异步 总 线 中 引信 时 钟 信号 ,其 “就 绪 ” 和 “完成 ”等 应 答 信号 都 在 时 钟 的 上 升 
沿 或 下 降 沿 被 采样 ,因而 不 受 其 他 时 间 信 号 的 干扰 。 底 板式 的 IO 总 线 大 多 采用 半 同 步 
方式 。 

分 离 事 务 协 议 (Split Transaction Protocol) 

将 一 个 事务 过 程 分 成 两 个 子 过 程 ,在 第 一 个 子 过 程 中 , 主 控 设 备 A 在 获得 总 线 使 用 权 
后 ,将 请 求 的 事务 类 型 (总 线 命令 )、 地 址 以 及 其 他 有 关 信 息 ( 如 标识 主 控 设 备 身份 的 编号 等 
发 送 到 总 线 上 ,从 设备 B 记 下 这 些 信息 。 主 控 设备 发 完 这 些 信息 后 便 立 即 释 放 总 线 ,这 样 
其 他 设备 便 可 使 用 总 线 ; 在 第 二 个 子 过 程 中 ,从 设备 B 收 到 主 控 设 备 A 发 来 的 信息 后 ,就 按 
照 其 请 求 的 命令 进行 相应 的 操作 , 当 准 备 好 主 控 设 备 所 需要 的 数据 后 ,从 设备 B 便 请 求 使 
用 总 线 ,一 旦 获得 使 用 权 , 则 从 设备 B 就 将 主 控 设 备 A 的 编号 及 所 需要 的 数据 等 送 到 总 线 
上 ,这 样 主 控 设备 A 便 可 接收 数据 。 这 种 事务 分 离 方式 的 优点 是 : 通过 在 不 传送 数据 期 间 
释放 总 线 , 使 得 其 他 申请 者 能 使 用 总 线 , 提 高 了 总 线 使 用 效率 。 但 是 这 种 方式 的 控制 相当 复 
杂 , 开 销 也 大 ,并 且 事 务 响 应 时 间 也 会 变 长 。 

即 插 即 用 (Plug and Play) 

即 播 即 用 功能 是 指 任何 扩展 卡 只 要 插 人 系统 的 插座 上 就 能 工作 。 这 种 技术 通过 自动 配 
置 计算 机 中 的 板 卡 和 其 他 设备 ,将 物理 设备 和 软件 (设备 驱动 程序 ) 相 配合 ,并 在 每 个 设备 和 
它 的 驱动 设备 之 间 建 立 通信 信道 。 


8.4 常见 问题 解答 


1， 机 器 字 长 、 编 址 单位 、 存 取 单 位 、 传 输 单位 、 指 令 字 长 各 指 什么 ?它们 之 间 有 何 关系 ? 

答 : 在 计算 机 内 部 ,有 指令 和 数据 两 大 类 信息 。 指 令 和 数据 都 以 二 进 制 形式 存放 
在 存储 器 中 ,运行 程序 时 ,需要 把 指令 和 数据 从 存储 器 读 出 ,再 通过 总 线 传输 到 CPU， 
然后 ,CPU 再 通过 执行 指令 来 对 操作 数 进行 相应 的 运算 ,最 后 把 结果 数据 送 到 寄存 器 
或 存储 器 中 。 所 以 ,在 设计 或 使 用 计算 机 过 程 中 ,要 涉及 很 多 问题 ,例如 ,指令 和 数据 
在 存储 器 中 按 什么 长 度 存 放 ; 写 人 或 读 出 时 按 什么 长 度 存 取 ; 在 总 线 上 传输 时 同时 传 
送 多 少 位 ;数据 和 指令 送 到 CPU 后 ,在 CPU 的 寄存 器 中 按 多 少 位 存放 ;在 运算 器 中 按 
多 少 位 来 运算 ,等 等 。 因 而 ,出 现 了 一 系列 有 关 信息 单位 和 信息 宽度 的 概念 ,这 些 概念 
非常 重要 ,但 比较 容易 混淆 ,需要 将 很 多 知识 和 概念 联系 在 一 起 ,才能 很 好 地 理解 这 些 
概念 及 其 相互 之 间 的 关系 。 

它们 的 定义 和 关系 说 明 如 下 。 

(1) 机 器 字 长 是 计算 机 的 一 个 非常 重要 的 指标 。 通 常 所 谓 32 位 机 器 或 64 位 机 器 ,就 
是 指 机 器 的 字 长 是 32 位 或 64 位 。 一 般 情 况 下 ,机 器 字 长 定义 CPU 中 定点 运算 数据 通路 的 
位 数 。 在 计算 机 中 ,“ 字 ”的 概念 经 常 出 现 。 一 个 “ 字 ” 的 宽度 并 不 等 于 机 器 字 长 。“ 字 ”作为 
机 器 中 所 有 信息 宽度 的 计量 单位 ,对 于 某 个 系列 机 来 说 ,其 字 宽 总 是 固定 的 。 例 如 ,在 
80x86 系列 中 ,一 个 字 的 宽度 为 16 位 ,因此 ,32 位 是 双 字 ,64 位 是 4 个 字 。 

(2) 编 址 单位 就 是 存储 单元 的 宽度 , 指 存储 器 中 具有 相同 地 址 的 若干 个 存储 元 件 ( 存 储 
元 \ 存 储 基 元 .记忆 单元 ) 构 成 的 一 个 二 进 制 代码 的 宽度 ,可 以 是 8 位 `16 位 、32 位 等 。 现 代 
大 多 数 计算 机 按 字 节 编 址 , 即 编 址 单位 为 8 位 ,每 一 个 字 节 有 一 个 地 址 。 由 此 可 见 , 一 个 数 
据 ( 如 32 位 整数 32 位 浮 点 数 或 64 位 浮 点 数 等 ) 可 能 占 多 个 存储 单元 ,CPU 要 求 一 次 从 存 
储 器 读 出 或 写 人 的 信息 也 可 能 有 多 个 存储 单元 。 

(3) 存 取 宽 度 是 指 一 次 从 一 个 由 多 个 DRAM 芯片 构成 的 存储 模块 中 同时 读 写 的 信息 
的 宽度 ,例如 ,假定 某 个 存储 模块 由 8 个 4096X4096X8 位 的 DRAM 芯片 按 交叉 编 址 方式 
构成 , 则 该 存储 模块 的 存 取 宽度 是 64 位 ,也 即 ,8 个 芯片 可 同时 读 写 , 每 个 芯片 同时 读 写 
8 位 ,因而 最 多 可 以 同时 存 取 64 位 信息 。 按 字 节 编 址 方式 下 , 存 取 宽 度 为 8 个 存储 单元 , 存 
取 单 位 可 以 是 8 位 、16 位 、32 位 或 64 位 等 。 

(4) 传输 宽度 就 是 总 线 宽度 ,也 就 是 一 次 最 多 能 在 总 线 上 传输 的 信息 位 数 。 对 于 存 
储 器 总 线 来 说 ,总 线 上 传输 的 信息 宽度 应 该 等 于 存储 器 的 存 取 宽 度 。 因 此 ,在 设计 系统 
时 ,应 考虑 传输 宽度 和 存 取 宽 度 的 匹配 ,并且 每 个 设备 中 的 总 线 接口 部 件 也 要 与 这 些 宽 
度 匹 配 。 

(5) 指令 字 长 指 指令 的 位 数 。 有 定 长 指令 字 机 器 和 不 定 长 指令 字 机 器 。 定 长 指令 字 机 
器 中 所 有 指令 的 位 数 是 相同 的 ,目前 定 长 指令 字 大 多 是 32 位 指令 字 。 不 定 长 指令 字 机 器 的 
指令 有 长 有 短 , 但 每 条 指令 的 长 度 一 般 都 是 8 的 倍数 。 因 此 ,一 个 指令 字 在 存储 器 中 存放 
时 ,可 能 占用 多 个 存储 单元 ;从 存储 器 读 出 并 通过 总 线 传输 时 ,可 能 分 多 次 进行 ,也 可 能 一 次 
读 多 条 指令 。 
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2, 数据 总 线 、 地 址 总 线 和 控制 总 线 是 分 开 连 接 在 不 同 设备 上 的 3 种 不 同 的 总 线 玛 ? 

答 : 不 是 。 它 们 只 是 系统 总 线 的 3 个 组 成 部 分 ,而 不 能 分 开 来 单独 连接 设备 。 系 统 总 
线 用 来 连接 计算 机 中 若干 主要 部 件 , 一 般 把 在 这 些 部 件 之 间 传 输 的 信息 分 为 数据 、 地 址 和 控 
制 3 类。 控制 信号 包括 总 线 命令 .定时 信号 (时 钟 和 握手 信号 等 ) .总线 请 求 .总线 允 许 . 中 断 
请 求 和 中 断 允 许 等 ,所 以 系统 总 线 相应 也 就 分 成 了 3 组 传输 线 : 数据 线 、 地 址 线 、 控 制 线 , 有 
时 习惯 于 把 它们 分 别称 为 : 数据 总 线 、 地 址 总 线 和 控制 总 线 。 

3. 为 什么 要 有 总 线 判 优 控制 ? 

答 : 总 线 是 共享 的 信息 传输 介质 ,同时 可 以 有 很 多 设备 连接 在 同一 个 总 线 上 ,但 每 一 时 
刻 总 线 只 能 完成 一 对 设备 之 间 的 信息 传送 。 当 有 多 个 设备 同时 要 使 用 总 线 传输 信息 时 ,如 
果 允 许 它们 同时 把 自己 的 信息 发 到 总 线 上 ,就 会 造成 混乱 ,因此 引入 了 总 线 判 优 机 制 , 它 能 
在 多 个 请 求 使 用 总 线 的 设备 中 选择 一 个 ,让 其 控制 总 线 来 传输 信息 ,其 他 设备 则 需 暂 时 等 待 
并 在 以 后 的 判 优 中 逐一 被 选中 。 

4. 一 台 机 器 里 面 只 有 一 个 总 线 吗 ? 

答 : 不 一 定 。 总 线 按 其 所 在 的 位 置 , 分 为 片 内 总 线 、 系 统 总 线 、 通 信 总 线 。 系 统 总 线 是 
指 在 CPU、 主 存 .VO 各 大 部 件 之 间 进 行 互 连 的 总 线 。 可 以 把 所 有 大 的 功能 部 件 都 连接 在 
一 个 总 线 上 ,也 可 以 用 几 个 总 线 分 别 连接 不 同 的 部 件 和 设备 。 因 此 ,有 单 总 线 结构 、 双 总 线 
结构 \ 三 总 线 结构 ,等 等 。 通 常 ,一 台 机 器 里 面 应 该 有 不 同 层次 的 多 个 总 线 存在 。 

5, 一 个 总 线 在 某 一 时 刻 可 以 有 多 对 主 ` 从 设备 进行 通信 玛 ? 

答 : 不 可 以 。 在 某 一 个 总 线 传输 周期 内 ,总线 上 只 能 有 一 个 主 控 设 备 控制 总 线 ,选择 一 
个 从 设备 与 之 进行 通信 ,或 对 所 有 其 他 设备 进行 广播 通信 。 所 以 , 某 一 时 刻 一 个 总 线 不 能 有 
多 对 主 、 从 设备 进行 通信 。 

6， 同 步 总 线 和 异步 总 线 的 特点 各 是 什么 ? 各 自 适 用 于 什么 场合 ? 

答 : 同步 总 线 的 特点 是 各 部 件 采用 时 钟 信号 进行 同步 ,协议 简单 ,因而 速度 快 ,接口 逻 
辑 很 少 。 但 总 线 上 的 每 个 部 件 必 须 在 规定 的 时 间 内 完成 要 求 的 动作 ,所 以 一 般 按 最 慢 的 部 
件 来 设计 公共 时 钟 。 而 且 由 于 时 钟 偏 移 问题 ,同步 总 线 不 能 很 长 。 所 以 ,一 般 同 步 总 线 用 在 
部 件 之 间距 离 短 、 存 取 速度 较 一 致 的 场合 。 通 常 ,CPU 内 部 总 线 、 处 理 器 总 线 等 采用 同步 总 
线 。 近 年 来 , 主 存 逐步 采用 同步 的 DRAM 芯片 构成 ,因此 存储 器 总 线 也 逐步 采用 同步 

异步 总 线 采用 应 答 方式 进行 通信 ,允许 各 设备 之 间 的 速度 有 较 大 的 差异 ,因此 ,通常 用 
于 在 具有 不 同 存 取 速 度 的 设备 之 间 进 行 通 信 。 通 常 连接 外 设 或 其 他 机 器 的 通信 总 线 采用 蜡 

7. 同一 个 总 线 不 能 既 采 用 同步 方式 又 采用 异步 方式 通信 ,是 吗 ? 

答 : 不 是 的 , 半 同 步 通信 总线 可 以 这 样 。 这 类 总 线 既 保留 了 同步 通信 的 特点 ,又 能 采用 
异步 应 答 方式 连接 速度 相差 较 大 的 设备 。 通 过 在 异步 总 线 中 引 和 人 时 钟 信号 ,其 就 绪 和 应 答 
等 信号 都 在 时 钟 的 上 升 沿 或 下 降 沿 有 效 , 面 不 受 其 他 时 间 信 和 号 的 干扰 。 遂 常 1/O 总 线 采用 
半 同 步 方 式 。 例 如 ,PCI 总 线 是 一 种 半 同 步 总 线 , 它 的 所 有 事件 在 时 钟 下 降 沿 同步 ,总 线 设 
备 在 时 钟 开始 的 上 升 沿 采样 总 线 信号 。 
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8.5 单项 选择 题 


1. 下 列 有 关 总 线 的 叙述 中 ,错误 的 是 ( )。 
A. 总 线 是 一 组 共享 的 信息 传输 线 
B. 系统 总 线 中 有 地 址 数据 和 控制 3 组 传输 线 
C. 同步 总 线 一 定 有 时 钟 信号 线 ,用 于 总 线 操作 的 定时 
D. 系统 总 线 始 终 由 CPU 控制 和 管理 
2， 假定 一 个 同步 总 线 的 工作 频率 为 33MHz, 总 线 中 有 32 位 数据 线 , 每 个 总 线 时 钟 传 
输 一 次 数据 , 则 该 总 线 的 最 大 数据 传输 率 为 ( Ds 
A. 66MB/s B. 132MB/s C. 528MB/s D. 1056MB/s 
3. 下 列 有 关 同 步 总 线 事务 的 描述 中 ,错误 的 是 ( bp 
A. 一 个 总 线 事务 所 用 时 间 由 多 个 总 线 时 钟 周期 组 成 
B. 总 线 事务 开始 时 通常 先 把 地 址 和 读 / 写 命令 送 到 总 线 上 
C.“ 存 储 器 读 ” 总 线 事务 中 数据 和 地 址 通常 不 会 同时 送 到 总 线 上 
D. 一 次 总 线 事务 只 能 完成 一 个 数据 交换 ,其 位 数 不 超 过 总 线 宽度 
4. 下 列 有 关 异 步 总 线 事务 的 描述 中 ,错误 的 是 ( De 
A， 总 线 事 务 总 是 在 一 个 主 控 设备 和 一 个 从 设备 之 间 进 行 
B. 总 线 事务 由 多 个 握手 过 程 组 成 ,每 次 握手 完成 一 个 数据 交换 
C. 一 个 总 线 事务 中 一 定 包括 “地 址 ”和 “数据 ”两 种 信息 的 交换 
D.“I/O 读 ”和 “I/O 写 ” 总 线 事 务 源 于 CPU 对 1/O 指令 的 执行 
5. 系统 总 线 中 控制 线 的 主要 功能 是 ( » 
A. 提供 定时 信和 号、 操作 命令 和 各 种 请 求 /回答 信号 等 
B. 提供 数据 信息 
C. 提供 时 序 信号 
D. 提供 主 存 和 I/O 模块 的 回答 信号 
6. 下 列 有 关 同 步 总 线 的 描述 中 ,错误 的 是 ( ss 
A. 用 一 个 公共 时 钟 信号 进行 同步 
B. 不 需要 应 答 ( 握 手 ) 信 和 号 
C. 要 求 挂 接 在 总 线 上 的 各 部 件 的 存 取 时 间 较 为 接近 
D. 总 线 长 度 不 受 限 制 ,可 以 很 长 
7. 下 列 关 于 异步 总 线 的 叙述 中 ,错误 的 是 ( js 
A. 需要 应 答 ( 握 手 ) 信 号 
B. 需 用 一 个 公共 的 时 钟 信号 进行 同步 
C. 可 以 实现 高 可 靠 的 数据 传输 
D. 挂 接 在 总 线 上 的 各 部 件 可 以 有 较 大 的 速度 差异 
8. 以 下 总 线 裁决 控制 方式 中 ,《 ) 方 式 对 电路 故障 最 敏感 。 
A. 链 式 查 询 B. 计数 器 定时 查询 
C,. 独立 请 求 D. 自 举 分 布 
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9. 假定 有 个 设备 挂 接 在 总 线 上 ,采用 链 式 查询 方式 时 需要 的 总 线 请 求 线 的 条 数 


A. 1 B. 2 C.n D. 2n 
10. 假定 有 ?个 设备 挂 接 在 总 线 上 ,采用 独立 请 求 方式 时 需要 的 总 线 请 求 线 的 条 数 
为 ( ” )。 
A. 1 B. 2 C.n D. 2n 
11. 在 计数 器 定时 查询 方式 下 , 若 每 次 计数 都 从 0 开始 , 则 (  ” )。 
A. 设备 号 小 的 设备 优先 级 高 B. 设备 号 大 的 设备 优先 级 高 
C. 每 个 设备 的 优先 级 均等 D. 每 个 设备 的 优先 级 随机 变化 
12. 在 计数 器 定时 查询 方式 下 , 若 每 次 计数 都 从 上 次 得 到 响应 的 设备 随后 一 个 设备 号 
开始 , 则 (  ”)。 
A. 设备 号 小 的 设备 优先 级 高 B. 设备 号 大 的 设备 优先 级 高 
C,. 每 个 设备 的 优先 级 均等 D. 每 个 设备 的 优先 级 随机 变化 
13. 增加 同步 总 线 带 宽 的 手段 有 很 多 ,但 以 下 ( ”) 不 能 提高 总 线 带 宽 。 
A. 采用 信号 线 复 用 技术 B. 增加 总 线 宽度 
C. 采用 突 发 (Burst) 传 送 方式 D. 提高 总 线 时 钟 频率 


14， 以 下 有 关 总 线 标 准 的 叙述 中 ,错误 的 是 ( )。 

A. 引入 总 线 标准 便于 设备 互 换 和 新 设备 的 添加 

B. 主板 上 的 处 理 器 总 线 和 存储 器 总 线 遂 常 是 专用 总 线 

C. IO 总 线 通 常 是 标准 总 线 , 所 以 PCI 总 线 是 标准 总 线 

D. 串 行 总 线 的 数据 传输 率 一 定 比 并 行 总 线 的 数据 传输 率 低 
15. 下 列 选项 中 的 英文 缩写 均 为 总 线 标准 的 是 (  )。 


A. PCI.CRT、USB、EISA B. ISA\CPI.VESA\EISA 

C. ISA\SCSI.RAM. MIPS D. ISAEISAPCI.PCI-Express 
16. 以 下 给 出 的 总 线 标准 中 ,不 属于 I/O 总 线 标 准 的 是 (。 )。 

A. PCI B. PCI-Express C. SCSI D. AGP 


17. 以 下 有 关 多 总 线 结构 系统 的 叙述 中 ,错误 的 是 (  )。 
A. 通常 越 靠近 CPU 的 总 线 传输 速率 越 高 
B. 通常 在 总 线 和 总 线 之 间 用 桥接 器 连接 
C. CPU 总 线 和 存储 器 总 线 都 比 I/O 总 线 快 
D. 系统 中 的 多 个 总 线 不 可 能 同时 传输 信息 


【参考 答案 】 

1.D 2.B 至 五 4.B 5. A 6. D 7. B 
8. A 9.A 10.C 1 A 12.C 13. A 14，D 
15. D 16.C 17. D 


8.6 分 析 应 用 题 


1. 假设 一 个 32 位 的 处 理 器 连接 了 一 个 32 位 宽 的 处 理 器 总 线 ,总 线 的 时 钟 频率 为 
400MHz, 支 持 多 种 总 线 事务 类 型 。 其 中 ,最 短 的 总 线 事务 类 型 是 存储 器 读 事务 ,需要 4 个 
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时 钟 周期 完成 ,第 1 个 时 钟 周期 送 地 址 和 读 命令 ,第 4 个 时 钟 周 期 取 数 ;最 长 的 总 线 事务 类 
型 是 突 发 传送 8 次 数据 ,需要 11 个 时 钟 周期 完成 ,第 1 个 时 钟 周期 送 地 址 和 读 命 令 , 第 4 个 
时 钟 周 期 开始 连续 传送 8 个 数据 ,每 个 时 钟 周期 传送 一 次 。 请 回答 下 列 问题 : 

(1) 该 总 线 是 同步 总 线 还 是 异步 总 线 ,为 什么 ? 

(2) 该 总 线 的 最 大 数据 传输 率 为 多 少 ? 

(3) 若 处 理 器 一 直 持续 发 起 最 短 总 线 事务 类 型 , 则 此 时 总 线 的 数据 传输 率 是 多 少 ? 

(4) 车 处 理 器 一 直 持续 发 起 最 长 总 线 事务 类 型 , 则 此 时 总 线 的 数据 传输 率 是 多 少 ? 

(5) 若 将 处 理 器 总 线 的 总 线 宽 度 扩 展 为 64 位 , 则 该 总 线 的 最 大 数据 传输 率 提高 到 
多 少 ? 

(6) 若 将 处 理 器 总 线 的 总 线 时 钟 频率 提高 到 800MHz, 则 该 总 线 的 最 大 数据 传输 率 提 
高 到 多 少 ? 

《7) 加 售 总 线 宽度 和 加 售 总 线 时 钟 频 率 相 比 , 哪 种 更 好 ? 

【分 析 解 答 】 

(1) 该 总 线 是 同步 总 线 ,因为 所 有 总 线 操作 都 在 总 线 时 钟 的 控制 下 进行 。 

(2) 总 线 最 大 数据 传输 率 就 是 总 线 带 宽 , 表 示 在 总 线 上 传输 数据 时 单位 时 间 内 传输 的 
最 大 数据 量 , 它 由 总 线 宽度 W、 总 线 时 钟 频率 下 和 一 个 时 钟 周期 内 传输 的 数据 个 数 M 确 
定 。 其 值 等 于 WXFXM。 因 此 该 总 线 的 最 大 数据 传输 率 为 32bX400MHzX1=12.8Gb/s 二 
1. 6GB/s。 

(3) 持续 进行 最 短 总 线 事务 类 型 时 ,总 线 数据 传输 率 为 4BX400MHz/4 一 400MB/s。 

(4) 持续 进行 最 长 总 线 事务 类 型 时 , 总线 数据 传输 率 为 4B X 8 X 400MHz/11 = 
1164MB/s。 

(5) 若 总 线 宽度 扩展 一 倍 , 则 总 线 最 大 数据 传输 率 提高 一 倍 , 即 为 3. 2GB/s。 

(6) 若 总 线 时 钟 频率 提高 一 倍 , 则 总 线 最 大 数据 传输 率 提 高 一 倍 , 即 为 3. 2GB/s。 

《7) 加倍 总 线 宽度 和 加 倍 总 线 时 钟 频率 的 措施 对 于 总 线 速 度 来 说 ,效果 是 一 样 的 。 

2. VAX SBI 总 线 采 用 分 布 式 的 自 举 裁决 方案 ,总 线 上 每 个 设备 有 唯一 的 优先 级 ,而 且 
被 分 配 一 根 独 立 的 总 线 请 求 线 REQ,SBI 有 16 根 这 样 的 请 求 线 (REQ0,… ,REQ15), 其 中 
REQ0 优先 级 最 高 ,请 问 : 最 多 可 有 多 少 个 设备 连 到 这 样 的 总 线 上 ? 为 什么 ? 

【分 析 解 答 】 

最 多 可 连接 16 个 设备 。 因 为 在 分 布 式 自 举 裁决 方式 的 总 线 中 , 除 优先 级 最 低 的 设备 
外 ,每 个 设备 都 使 用 一 根 信 号 线 发 出 总 线 请 求 信号 ,以 被 优先 级 比 它 低 的 设备 查看 ;而 优先 
级 最 低 的 那个 设备 无 须 送 出 总 线 请 求 信 号 。 此 外 ,还 需要 一 根 总 线 请 求 信号 线 用 于 设置 “总 
线 忙 ”信和 号 ,所 以 ,16 根 总 线 请 求 线 中 ,有 15 根 分 别 用 于 15 个 不 同 设备 的 总 线 请 求 , 故 最 多 
可 挂 接 15 十 1 二 16 个 设备 。 

3. 试 设计 一 个 采用 固定 优先 级 的 具有 4 个 输入 的 集中 式 独 立 请 求 裁决 器 。 

【分 析 解 答 】 

假设 BRe 一 BRs 为 4 个 总 线 请 求 线 ,优先 级 由 高 到 低 ,BG。 一 BG。 为 对 应 的 4 个 总 线 允 
许 线 , 则 固定 优先 级 的 并 行 判 优 电路 的 逻辑 方程 如 下 。 

BG, =BR, ; 

BG, =BR,BR,; 


s 
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BG, =BR;, BR BR,; 

BG, =BR, BR; BR, BR,. 

根据 上 述 逻 辑 表达 式 ,不 难 实现 一 个 独立 请 求 裁决 器 。 

4. 假设 某 存储 器 总 线 采 用 同步 通信 方式 ,时 钟 频率 为 50OMHz, 每 个 总 线 事务 以 突 发 方 
式 传输 8 个 字 , 以 支持 块 长 为 8 个 字 的 cache 行 读 和 cache 行 写 ,每 字 4 字 节 。 对 于 读 操 作 ， 
访问 顺序 是 1 个 时 钟 周 期 接收 地 址 ,3 个 时 钟 周期 等 待 存储 器 读数 ,8 个 时 钟 周期 用 于 传输 
8 个 字 。 对 于 写 操作 ,访问 顺序 是 1 个 时 钟 周期 接收 地 址 ,2 个 时 钟 周期 延迟 ,8 个 时 钟 周 期 
用 于 传输 8 个 字 ,3 个 时 钟 周期 恢复 和 写 人 纠 错 码 。 对 于 以 下 访问 模式 , 求 出 该 存储 器 读 / 
写 时 在 存储 器 总 线 上 的 数据 传输 率 。 

(1) 全 部 访问 为 连续 的 读 操作 。 

(2) 全 部 访问 为 连续 的 写 操作 。 

(3) 65% 的 访问 为 读 操 作 ,35% 的 访问 为 写 操作 。 

【分 析 解 答 】 

(1) 读 取 8 个 字 用 了 1 十 3 十 8 三 12 个 时 钟 周 期 , 故 数 据 传输 率 为 8 X 4B/(12 xX 
1/50MHz)=133. 3MB/s。 

(2) 写 人 8 个 字 用 了 1 十 2 十 8 十 3 二 14 个 时 钟 周 期 , 故 数据 传输 率 为 8X4B/(14X 
1/50MHz)=114. 3MB/s。 

《3) 可 用 两 种 方式 估算 。 若 用 数据 传输 率 加 权 平 均 , 则 为 133. 3MB/sX65% 十 
114. 3MB/sX35% 二 126. 7MB/s; 车 用 时 钟 周期 数 的 加 权 平 均 , 则 为 8X4B/((12X65% 十 14X 
35%)X1/50MHz)=126.0 MB/s。 

5. 在 一 个 字 长 为 32 位 的 计算 机 系统 中 ,假定 存储 器 分 别 连接 以 下 两 种 不 同 的 同步 
总 线 。 

总 线 1 是 64 位 数据 和 地 址 复 用 的 总 线 。 能 在 一 个 时 钟 周期 中 传输 一 个 64 位 的 数据 或 
地 址 ,支持 最 多 连续 8 个 字 的 存储 器 读 和 存储 器 写 总 线 事 务 。 任 何 一 次 读 写 操作 总 是 先 用 
一 个 时 钟 周 期 传送 地 址 ,然后 有 两 个 时 钟 周期 的 延迟 等 待 , 从 第 4 时 钟 周期 开始 ,存储 器 准 
备 好 数据 ,总 线 以 每 个 时 钟 周期 两 个 字 的 速度 传送 ,最 多 传送 8 个 字 。 

总 线 2 是 分 离 的 32 位 地 址 和 32 位 数据 的 总 线 ,支持 最 多 连续 8 个 字 的 存储 器 读 和 存 
储 器 写 总 线 事务 。 读 操作 过 程 为 : 一 个 时 钟 周期 传送 地 址 ,两 个 时 钟 周期 延迟 等 待 ,从 第 
4 时钟 周 期 开始 ,存储 器 准备 好 数据 ,总 线 以 每 时 钟 一 个 字 的 速度 传输 最 多 8 个 字 。 对 于 写 
操作 ,在 第 一 个 时 钟 周期 内 ,第 一 个 数据 字 与 地 址 一 起 传输 ,经 过 两 个 时 钟 周期 的 延迟 等 待 
后 ,第 一 个 字 写 人 存储 器 , 并 在 后 面 7 个 时 钟 周 期 中 ,以 每 个 时 钟 一 个 字 的 速度 最 多 传输 
7 个 余下 的 数据 字 。 

假定 这 两 种 总 线 的 时 钟 频率 都 为 100MHz, 请 回答 下 列 问题 。 

(1) 两 种 总 线 的 最 大 数据 传输 率 ( 总 线 带 宽 ) 分 别 为 多 少 ? 

(2) 连续 进行 单个 字 的 存储 器 读 总 线 事务 时 ,两 种 总 线 的 数据 传输 率 分 别 是 多 少 ? 

(3) 连续 进行 单个 字 的 存储 器 写 总 线 事 务 时 ,两 种 总 线 的 数据 传输 率 分 别 是 多 少 ? 

(4) 每 次 传输 8 个 字 的 数据 块 ,60% 是 读 操作 总 线 事 务 ,40% 是 写 操作 总 线 事务 ,两 种 
总 线 的 数据 传输 率 分 别 是 多 少 ? 

《5) 通过 对 以 上 各 种 数据 的 分 析 对 比 , 给 出 相应 的 结论 。 


系统 总 线 


【分 析 解 答 】 

(1) 总 线 1 在 传送 数据 时 以 每 个 时 钟 周期 两 个 字 的 速度 进行 ,所 以 它 的 最 大 数据 传输 
率 为 32bX2X100MHz 一 6400Mb/s 王 800MB/s。 总 线 2 在 传送 数据 时 以 每 个 时 钟 周期 一 
个 字 的 速度 进行 ,所 以 它 的 最 大 数据 传输 率 为 3?bX100MHz 一 3200Mb/s 一 400MB/s。 

(2) 总 线 1 虽然 每 个 时 钟 周 期 可 传送 两 个 字 ,但 在 单字 传输 总 线 事 务 中 每 次 只 需要 传 
送 一 个 字 ,每 个 总 线 事 务 占 1 十 2 十 1 二 4 个 时 钟 周 期 ,因此 连续 进行 单个 字 的 存储 器 读 总 线 
事务 时 ,总线 1 的 数据 传输 率 为 4BX100MHz/4 二 100MB/s。 总 线 2 每 个 时 钟 周期 读 一 个 
字 ,一 个 单字 存储 器 读 总 线 事务 占 1 十 2 十 1==4 个 时 钟 周期 ,因此 连续 进行 单个 字 的 存储 器 
读 总 线 事务 时 ,总 线 2 的 数据 传输 率 也 为 100MB/s。 

(3) 总 线 1 的 单字 存储 器 写 总 线 事务 和 单字 存储 器 读 总 线 事务 的 情况 一 样 ,因此 ,连续 
进行 单个 字 的 存储 器 写 总 线 事务 时 ,数据 传输 率 也 是 100MB/s。 总 线 2 的 单字 存储 器 写 总 
线 事务 占 1 十 2 二 3 个 时 钟 周期 ,因此 连续 进行 单个 字 的 存储 器 写 总 线 事务 时 ,其 数据 传输 率 
为 4BX100MHz/3=133. 3MB/s。 

(4) 通过 总 线 1 进行 存储 器 读 和 写 8 个 字 所 用 时 间 都 为 1 十 2 十 8/2 二 7 个 时 钟 周期 ,所 
以 在 连续 进行 多 个 8 字 突 发 传送 总 线 事务 时 ,总 线 1 的 数据 传输 率 为 8X4BX100MHz/7= 
457MB/s。 总 线 2 的 存储 器 读 事 务 和 存储 器 写 事务 所 用 时 间 不 等 , 突 发 读 8 个 字 所 用 的 时 
间 为 1 十 2 十 8 一 11 个 时 钟 周期 , 突 发 写 8 个 字 所 用 的 时 间 为 1 十 2 十 7 一 10 个 时 钟 周期 , 因 
此 , 当 60%% 是 读 操作 总 线 事务 ,40%% 是 写 操作 总 线 事务 时 ,总线 2 的 数据 传输 率 为 8X4BX 
(100MHz/11) X60%+8X4BX (100MHz/10) X40% =303MB/s。 

(5) 总 线 1 和 总 线 2 的 数据 /地 址 线 都 是 64 位 ,总 线 1 采用 数据 /地 址 线 复 用 ,总 线 2 采 
用 分 离 的 数据 线 和 地 址 线 。 以 下 是 对 两 种 总 线 在 各 种 情况 下 的 分 析 以 及 得 出 的 结论 。 

根据 (1) 中 对 两 种 总 线 最 大 数据 传输 率 的 计算 ,可 知 : 采用 数据 /地 址 线 复 用 技术 ,能 够 
得 到 更 大 的 峰值 数据 传输 率 。 因 为 ,一 旦 进入 到 数据 传输 阶段 ,用 64 位 数据 线 传输 数据 肯 
定 比 用 32 位 数据 线 传输 数据 要 快 一 倍 。 

根据 (2) 和 (3) 中 对 两 种 总 线 在 单字 传输 情况 下 数据 传输 率 的 计算 ,可 知 : 采用 数据 /地 
址 线 分 离 技 术 , 可 以 得 到 更 大 的 单字 传输 数据 速率 。 因 为 ,单字 传输 时 ,数据 /地 址 线 复 用 时 
得 到 的 两 倍 宽度 的 数据 线 只 能 传送 一 个 字 , 同时 因为 信号 线 复 用 而 不 能 将 数据 和 地 址 同时 
送出 ,使 得 写 事务 所 用 时 间 延 长 ,因而 ,采用 数据 /地 址 线 复 用 技术 的 情况 下 ,得 到 的 单字 传 
输 数 据 速率 更 低 。 

根据 (4) 中 对 突 发 传送 8 个 数据 时 数据 传输 率 的 计算 ,可 知 : 采用 数据 /地 址 线 复 用 技 
术 , 能 够 得 到 更 大 的 突 发 数据 传输 率 。 因 为 ,在 突 发 传送 事务 中 需要 连续 传送 多 个 数据 ,此 
时 ,64 位 数据 线 肯 定 比 32 位 数据 线 传 送 得 快 。 

6. 假定 主 存 和 CPU 之 间 连 接 的 同步 总 线 具 有 以 下 特性 : 支持 4 字 和 16 字 两 种 长 度 的 
数据 传送 , 字 长 为 32 位 ,总 线 时 钟 频率 为 200MHz, 总 线 宽度 为 64 位 ,每 个 64 位 数据 的 传 
送 需要 一 个 时 钟 周 期 ,向 主 存 发 送 一 个 地 址 需要 一 个 时 钟 周期 ,每 两 个 总 线 事务 之 间 有 两 个 
空闲 时 钟 周 期 。 若 访问 主 存 时 最 初 4 个 字 的 存 取 时 间 为 200ns, 随后 每 存 取 一 个 4 字 的 时 
间 是 20ns, 则 在 4 字 和 16 字 两 种 传输 方式 下 ,该 总 线 上 传输 256 个 字 时 的 数据 传输 率 分 别 
是 多 少 ? 你 能 从 计算 结果 中 得 到 什么 结论 ? 
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【分 析 解 答 】 

总 线 时 钟 频率 为 200MHz, 因 而 总 线 时 钟 周期 为 1/1200MHz 一 5ns。 

对 于 4 字 传 送 方式 ,每 个 总 线 事务 由 一 个 地 址 传送 跟 一 个 4 字 的 数据 块 传送 组 成 。 即 
每 个 总 线 事务 传送 一 个 4 字 的 数据 块 。 每 个 数据 块 的 传送 过 程 如 图 8. 1 所 示 。 
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图 8.1 题 6 中 4 字 传 送 方式 下 的 数据 传送 过 程 


CPU: 


首先 ,CPU 发 送 一 个 首 地 址 到 主 存 , 一 个 时 钟 周 期 后 , 主 存 读 开始 的 4 个 字 , 用 了 
200ns/5ns 一 40 个 时 钟 周期 ,然后 在 总 线 上 传输 4 个 字 , 所 用 的 时 钟 周期 数 为 4X32/64 二 2。 
在 下 次 总 线 事务 开始 之 前 ,最 后 有 两 个 空闲 时 钟 周 期 。 所 以 一 次 总 线 事务 总 共 需 要 
1 十 40 十 2 十 2 一 45 个 时 钟 周期 ,256 个 字 需 256/4 = 二 64 个 事务 ,因而 整个 传送 需 45 X 64= 
2880 个 时 钟 周 期 ,得 到 总 延 时 为 2880 X 5ns 一 14400ns。 每 秒 钟 进行 的 总 线 事务 数 为 
64/(14400X10 习 ) 二 4. 44M。 总 线 的 数据 传输 率 为 (256X4B)/14400ns 二 71. 11MB/s。 

对 于 16 字 传 送 方式 ,每 个 总 线 事务 由 一 个 地 址 传送 跟 一 个 16 字 的 数据 块 传送 组 成 。 
即 每 个 总 线 事 务 传送 一 个 16 字 的 数据 块 。 每 个 数据 块 的 传送 过 程 如 图 8. 2 所 示 。 
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图 8.2 题 6 中 16 字 传送 方式 下 的 数据 传送 过 程 


从 图 8.2 可 以 看 出 ,一 次 总 线 事 务 的 时 钟 周 期 数 为 1 十 40 十 4X (2 十 2) 二 57。256 个 字 需 
256/16= 二 16 个 事务 ,因此 整个 传送 需 57X16==912 个 时 钟 周期 。 因 而 总 延 时 为 912X5ns 一 
4560ns, 仅 约 4 字 传送 的 1/3。 每 秒 钟 总 线 事务 数 为 16/ (4560X10-*) 王 3.51M/s。 总 线 数 
据 传 输 率 为 (256X4B)/4560ns 一 224. 56MB/s。 与 4 字 传 送 相 比 ,是 它 的 3.6 倍 。 

由 此 可 见 , 在 一 次 总 线 事务 中 传送 的 数据 块 越 大 , 则 数据 传输 率 越 高 。 

7. 在 题 6 所 述 的 系统 中 ,假定 访问 主 存 时 最 初 4 个 字 的 读 取 时 间 为 148ns, 随后 每 读 一 
个 4 字 的 时 间 为 26ns, 则 在 4 字 和 16 字 两 种 传输 方式 下 ,CPU 从 主 存 读 出 256 个 字 时 ,该 
总 线 上 的 数据 传输 率 分 别 是 多 少 ? 和 上 题 计算 结 果 进 行 比较 分 析 , 并 给 出 相应 的 结论 。 

【分 析 解 答 】 

因为 最 初 4 个 字 的 读 取 时 间 从 200ns 变 为 148ns, 所 以 主 存 读 开 始 的 4 个 字 只 用 了 
148ns/5ns 一 29. 6 个 时 钟 周 期 ,当主 存 存 取 时 间 不 是 总 线 时 钟 周期 的 整数 倍 时 , 主 存 会 先 准 
备 好 数据 ,等待 下 一 个 总 线 时 钟 周 期 到 来 后 ,开始 在 总 线 上 传送 数据 。 因 此 ,开始 的 4 字 的 
读 取 时 间 实 际 上 相当 于 30 个 时 钟 周期 的 时 间 。 

4 字 传 输 方式 下 ,每 个 数据 块 的 传送 过 程 如 图 8. 3 所 示 。 

从 图 8. 3 中 可 以 看 出 ,一 次 总 线 事务 总 共 需 要 1 十 30 十 2 十 2 一 35 个 时 钟 周期 ,256 个 字 
需 256/4= 64 个 事务 ,因而 整个 传送 需 35 X 64 王 2240 个 时 钟 周期 ,总 线 的 数据 传输 率 为 
(256X4B)/(2240X5ns) 一 91.43MB/s。 
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图 8.3 题 7 中 4 字 传 送 方式 下 的 数据 传送 过 程 


因为 从 第 二 个 4 字 开始 ,每 读 一 个 4 字 的 时 间 为 26ns, 相 当 于 26ns/5ns 一 5. 2 个 总 线 时 
钟 周期 的 时 间 。 在 16 字 传 输 方式 下 ,每 个 数据 块 的 传送 过 程 如 图 8.4 所 示 。 
1 clock 30 clocks 2clocks 2 clocks 2 clocks 


数据 块 主 存 读 出 
首 址 开始 4 个 字 


CP 


2 clocks 2 clocks [oe 
下 主 存 
前 两 个 时 钟 

个 字 ， 后 两 个 时 钟 空闲 


两 个 时 
外 字 ， 后 4 个 时 钟 空闲 传输 前 4 


图 8.4 题 7 中 16 字 传送 方式 下 的 数据 传送 过 程 


从 图 8.4 中 可 以 看 出 ,一 次 总 线 事务 总 共 需 要 1 十 30 十 3X6 十 2 十 2 二 53 个 时 钟 周 期 ， 
256 字 需 256/16 王 16 个 事务 ,因而 整个 传送 需 53 X16== 848 个 时 钟 周期 ,总 线 的 数据 传输 
率 为 (256X4B)/(848X5ns) 一 241.51MB/s。 

与 第 6 题 相 比 ,4 字 传输 方式 下 ,速度 提高 了 (91. 43 一 71.11)771. 11X100 上 一 28.6% 
16 字 传输 方式 下 ,速度 只 提高 了 (241. 51 一 224. 56)/224. 56X100% 二 7. 5%。 由 此 可 知 ,对 
于 小 数据 块 的 传输 , 主 存 首次 读 取 的 速度 更 重要 ;而 对 于 大 数据 块 的 传输 , 则 首次 读 取 速 度 
和 随后 的 读 取 速 度 都 很 重要 。 

8. 假定 主 存 和 CPU 之 间 连 接 的 同步 总 线 具 有 以 下 特性 : 采用 数据 和 地 址 线 分 离 方 
式 , 总 线 宽度 和 机 器 字 长 都 为 32 位 ,总 线 时 钟 频率 为 200MHz, 每 个 数据 或 地 址 传送 需 一 个 
时 钟 周期 ,每 个 总 线 事务 之 间 有 两 个 空闲 时 钟 周期 。 对 于 写 操作 , 主 存 最 初 4 个 字 的 写 人 时 
间 为 200ns, 随 后 每 写 人 一 个 4 字 的 时 间 是 20ns, 则 写 人 256 个 字 到 主 存 时 ,在 4 字 和 16 字 
两 种 传输 方式 下 该 总 线 的 数据 传输 率 分 别 是 多 少 ? 

【分 析 解 答 】 

每 个 时 钟 周 期 为 1/200MHz= 5ns。 在 4 字 传 输 方式 下 ,每 个 数据 块 的 写 人 过 程 如 
图 8.5 所 示 。 


CPpU lclock, ____ ,lclock 。 40 ee 2 clocks 
首 址 及 传送 
首 字 第 4 字 


图 8.5 题 8 中 4 字 传送 方式 下 的 数据 传送 过 程 


主 存 


首先 ,CPU 发 送 首 地 址 和 第 一 个 字 到 主 存 需要 1 个 时 钟 周期 ,接着 发 送 3 个 字 到 主 存 
需要 3 个 时 钟 周期 , 当主 存 接收 到 地 址 和 4 个 字 后 ,开始 将 一 个 4 字 写 入 主 存 ,需要 
200ns/5ns 一 40 个 时 钟 周 期 。 在 下 一 次 总 线 事务 开始 之 前 ,最 后 有 两 个 空闲 时 钟 周期 。 所 
以 一 次 总 线 事务 总 共 需 要 1 十 3 十 40 十 2 一 46 个 时 钟 周期 ,256 个 字 需 256/4 一 64 个 事务 , 因 
而 整个 传送 需 46X 64 一 2944 个 时 钟 周期 ,总 延 时 为 2944X 5ns 二 14720ns。 总 线 数据 传输 
率 为 (256X4B)/14720ns 一 69. 57MB/s。 

在 16 字 传 输 方式 下 ,每 个 数据 块 的 传送 过 程 如 图 8.6 所 示 。 

首先 ,与 4 字 传 输 方式 一 样 ,CPU 在 4 个 时 钟 周期 内 ,发 送 首 地 址 和 第 一 个 4 字 到 主 
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图 8.6 题 8 中 16 字 传送 方式 下 的 数据 传送 过 程 


存 , 当 主 存 接收 到 首 地 址 和 4 字 后 ,开始 将 第 一 个 4 字 写 人 主 存 ,需要 200ns/5ns 王 40 个 时 
钟 周期 ,在 此 期 间 ,总 线 用 其 中 最 后 4 个 时 钟 周期 传送 第 二 个 4 字 。 由 图 8.6 可 知 , 一 次 总 
线 事务 总 共 需 56 个 时 钟 周期 ,256 个 字 需 256/16 王 16 个 事务 ,因而 整个 传送 需 56 X16= 
896 个 时 钟 周期 ,得 到 总 延 时 为 896X5ns 一 4480ns。 每 秒 钟 进 行 的 总 线 事 务 数 为 16/(4480X 
10”) 一 3.57M。 总 线 的 数据 传输 率 为 (256X4B)/4480ns 一 228. 57MB/s。 

9. 某 通 信和 总 线 采用 蜡 步 通信 方式 ,支持 突 发 传输 ,总 线 宽度 为 32 位 ,数据 线 和 地 址 线 
复 用 , 主 、 从 设备 各 有 一 个 “就 绪 ” 信 号 ,采用 全 互 锁 方式 传送 地 址 和 数据 信息 , 主 、 从 设备 之 
间 每 次 握手 最 少 需要 40ns。 总 线 上 的 主 控 设 备 和 从 设备 都 有 1 字 宽 的 总 线 接口 。 若 每 一 
次 I/O 请 求 都 要 求 突 发 传输 16 个 字 ,每 个 字 为 32 位 , 则 用 该 总 线 连接 以 下 各 种 不 同 的 从 设 
备 时 ,该 总 线 上 连续 进行 I/O 请 求 事务 时 的 数据 传输 率 至 多 各 是 多 少 ? 

(1) 从 设备 1: 准备 第 一 个 字 的 时 间 最 快 为 200ns, 以 后 每 个 字 的 准备 时 间 最 快 
为 20ns。 

(2) 从 设备 2: 准备 第 一 个 字 的 时 间 最 快 为 200ns, 以 后 每 个 字 的 准备 时 间 最 快 
为 164ns。 

【分 析 解 答 】 

因为 采用 全 互 锁 方式 传送 地 址 和 数据 信息 ,因此 ,每 个 地 址 和 数据 信息 的 传送 需要 3 次 
握手 。 

(1) 对 于 从 设备 1, 其 I/O 请 求 事务 过 程 如 图 8.7 所 示 。 


ReadReq 


BurstReq 


Address 


Data 


Ready 


Ack 


图 8.7 题 9 中 异步 通信 方式 下 数据 传送 过 程 


Q@ 主 设备 送出 地 址 信息 和 事务 类 型 信息 (IO 请求 命令 ReadReq) ,并 使 BurstReq 有 
效 ,表示 是 突 发 传送 方式 ; 四 从 设备 送出 回答 信号 Ack, 并 对 地 址 译 码 , 开 始 准备 第 一 个 字 ， 
同时 , 主 设备 接收 到 回答 信号 Ack 后 ,使 ReadReq 信和 号 无 效 , 并 撤销 地 址 信息 ; 图 从 设备 跟 
着 使 Ack 信和 号 无 效 ,继续 准备 数据 ; @ 国 从 设备 准备 好 第 一 个 字 后 , 送 数据 到 数据 线 ,并 发 出 
就 绪 CReady) 信 和 号, 主 设备 接收 到 Ready 信号 后 开始 读 取 数 据 ; 加 主 设备 发 出 Ack 信号 , 表 
示 数 据 已 成 功 读 取 ; @ 从 设备 发 现 Ack 信号 后 得 知 数据 传送 完成 ,因而 撤销 Ready 信号 并 
撤销 数据 信息 ; @ 主 设备 发 现 Ready 撤销 后 ,跟着 撤销 Ack 信号。 


系统 总 线 


每 次 数据 交换 的 全 互 锁 过 程 需要 3 次 握手 时 间 , 并 且 在 相 邻 两 次 数据 交换 之 间 需 要 一 
次 握手 时 间 ,因而 一 次 数据 交换 共 需 要 4 次 握手 时 间 , 故 每 次 交换 过 程 所 用 时 间 为 max(4X 
40,20) 一 160ns。 每 次 在 总 线 上 交换 第 iCL<i<16) 个 字 时 ,从 设备 准备 第 i 十 1 个 字 , 最 后 在 
总 线 交 换 第 16 个 字 时 ,从 设备 空闲 ,因而 最 后 一 个 数据 交换 所 用 时 间 为 3X40 王 120ns。 最 
后 一 次 交换 结束 后 ,BurstReq 信和 号 无 效 ,表示 突 发 传送 结束 。 综 上 所 述 ,一 次 IO 请 求 传送 
16 个 字 的 时 间 最 快 为 40 十 max(3X40,200) 十 15X160 十 120 一 2760ns, 因 此 ,连续 进行 1/O 
请 求 事 务 时 的 数据 传输 率 至 多 是 16 X4B/2760ns 一 23. 19MB/s。 

《2) 对 于 从 设备 2, 其 IO 请 求 事务 过 程 与 从 设备 1 类 似 , 只 是 每 次 准备 数据 所 需 时 间 
不 同 。 在 总 线 上 通过 全 互 锁 方式 传输 第 is<i<16) 个 字 时 ,从 设备 准备 第 i 十 1 个 字 , 因 此 
前 15 个 数据 交换 过 程 所 用 时 间 为 max(4X40,164) 一 164ns, 最 后 一 个 字 的 传送 需 3X40= 
120ns。 综 上 所 述 , 对 于 从 设备 2, 一 次 I/O 请 求 传送 16 个 字 的 时 间 最 快 为 40 十 max(3X 
40,200) 十 15X164 十 120 一 2820ns, 因 此 ,连续 进行 IO 请 求 事务 时 的 数据 传输 率 至 多 是 
16 X4B/2820ns 一 22. 70MB/s。 

10. 某 I/O 总 线 采 用 半 同 步 通信 方式 ,支持 突 发 传输 ,总 线 宽 度 为 32 位 ,数据 线 和 地 址 
线 复 用 ,总线 时 钟 频率 为 200MHz, 主 \ 从 设备 各 有 一 个 “就 绪 ? 信 号 ,采用 非 互 锁 方式 传送 数 
据 信息 。 总 线 上 的 主 控 设 备 和 从 设备 都 有 1 字 宽 的 总 线 接口 ,每 个 总 线 事务 之 间 有 两 个 空 
闲 时 钟 周期 。 若 每 一 次 I/O 请 求 要 求 传输 16 个 字 ,每 个 字 为 32 位 , 则 用 该 总 线 连接 以 下 各 
种 不 同 的 从 设备 时 ,该 总 线 上 连续 进行 /O 请 求 事务 时 的 数据 传输 率 至 多 各 是 多 少 ? 

(1) 从 设备 1: 准备 第 一 个 字 的 时 间 最 快 为 200ns, 以 后 每 个 字 的 准备 时 间 最 快 
为 20ns。 

(2) 从 设备 2: 准备 第 一 个 字 的 时 间 最 快 为 202ns, 以 后 每 个 字 的 准备 时 间 最 快 
为 24ns。 

【分 析 解 答 】 

总 线 采 用 非 互 锁 的 半 同 步 方式 传送 数据 信息 ,说 明 主 、 从 设备 之 间 只 要 开始 时 握手 一 
次 ,并 且 , 每 次 信息 交换 的 时 间 都 是 时 钟 周期 的 整数 倍 。 当 主 设备 没有 准备 好 接收 数据 时 ， 
它 使 自己 的 “就 绪 ?信号 无 效 ,告诉 从 设备 将 当前 数据 继续 在 数据 线 上 放置 一 个 时 钟 周期 ; 当 
从 设备 没有 准备 好 数据 时 , 它 使 自己 的 “就 绪 ” 信 号 无 效 ,告诉 主 设备 当前 时 钟 没 有 有 效 数据 
在 数据 线 上 ;总线 的 时 钟 频率 为 200MHz, 因 此 总 线 时 钟 周期 为 1/200MHz 一 5ns。 

(1) 对 于 从 设备 1, 其 1/O 请 求 事务 过 程 如 下 。@ 主 设备 用 1 个 时 钟 周期 送出 地 址 信息 
和 事务 类 型 信息 (I/O 请 求 命令 ) ,并 在 结束 时 送出 “就 绪 ” 信 号 ,告知 从 设备 自己 已 准备 好 接 
收 数据 。@ 四 从 设备 对 地 址 译 码 并 准备 第 一 个 字 , 用 了 200ns, 相 当 于 200/5 王 40 个 时 钟 周 
期 。 结 束 时 ,从 设备 送出 “就 绪 ” 信 号 ,告知 主 设备 自己 已 经 准备 好 数据 。@ 最 好 的 情况 下 ， 
以 后 每 隔 20ns(4 个 时 钟 周期 ) 从 设备 准备 好 数据 ,也 就 是 说 ,每 隔 4 个 时 钟 周 期 主 设备 可 以 
取 到 1 个 字 , 后 续 一 共有 15 个 字 , 因 此 用 了 4X15==60 个 时 钟 周 期 。@ 图 最 后 两 个 时 钟 空闲 。 
综 上 所 述 ,一 次 I/O 请 求 传送 16 个 字 的 时 间 最 快 为 (1 十 40 十 60 十 2)X5ns 一 515ns, 因 此 , 连 
续 进 行 I/O 请 求 事务 时 的 数据 传输 率 至 多 是 16X4B/515ns 王 124. 27MB/s。 

《2) 对 于 从 设备 2, 其 1/O 请 求 事务 过 程 如 下 。@ 主 设备 用 1 个 时 钟 周期 送出 地 址 信息 
和 事务 类 型 信息 (I/O 请求 命令 ) ,并 在 结束 时 送出 “就 绪 ” 信 号 ,告知 从 设备 自己 已 准备 好 接 
收 数据 。@ 从 设备 对 地 址 译 码 并 准备 第 一 个 字 , 因为 202ns/5ns 一 40.4, 相 当 于 41 个 时 钟 
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周期 。 结 束 时 ,从 设备 送出 “就 绪 ” 信 号 ,告知 主 设备 自己 已 经 准备 好 数据 。@ 最 好 的 情况 
| 下 ,以 后 每 隔 24ns( 相 当 于 5 个 时 钟 周 期 ) 从 设备 准备 好 数据 ,也 就 是 说 ,每 隔 5 个 时 钟 周期 
主 设备 取 到 1 个 字 , 后 续 一 共有 15 个 字 , 因 此 用 了 5X15 一 75 个 时 钟 周期 。@ 最 后 两 个 时 


钟 空闲 。 综 上 所 述 ,一 次 MO 请 求 传送 16 个 字 的 时 间 最 快 为 (1 十 41 十 75 十 2) X 5ns 一 
595ns, 因此 ,连续 进行 7O 请 求 事务 时 的 数据 传输 率 至 多 是 16 X4B/595ns 一 107.56MB/s。 


第 章 
= 输入 输出 组 织 


9.1 教学 目标 和 内 容 安排 


主要 教学 目标 : 

使 学 生 了 解 输入 /输出 系统 涉及 的 软 硬 件 概 念 和 知识 体系 ,为 学 习 操作 系统 中 的 存储 管 
理 和 设备 管理 等 内 容 打下 坚实 基础 。 本 章 主 要 内 容 包 括 输 入 /输出 系统 的 组 成 .I/O 〇 对 系统 
性 能 的 影响 、I/O 〇 设备 的 种 类 和 特性 、 磁 盘存 储 器 的 主要 性 能 指标 .I/O 接口 的 职能 和 分 类 、 
I/ 〇 设备 和 主机 的 连接 方式 、 程 序 查询 1/ 〇 方式 .中断 I/10 方 式 和 DMA 方式 等 。 

基本 学 习 要 求 : 

(1) 了 解 常用 外 部 设备 的 基本 原理 。 

(2) 了 解 磁盘 存储 器 的 主要 技术 指标 。 

(3) 了 解 磁盘 存储 器 的 记录 格式 。 

(4) 了 解 宛 余 磁 盘 阵 列 (RAID) 的 基本 原理 。 

(5) 了 解 /O 接口 的 功能 和 基本 结构 。 

(6) 理解 I/O 接口 和 I/O 端口 的 差别 。 

(7) 了 解 各 种 I/O 接口 类 型 的 特点 。 

(8) 理解 I/ 端口 的 编 址 方式 。 

(9) 了 解 各 种 MO 传送 控制 方式 的 特点 和 适用 场合 。 

(10) 了 解 程 序 直 接 控制 (查询 ) 方 式 的 特点 和 工作 流程 。 

(11) 了 解 中 断 IO 方式 的 特点 和 工作 过 程 。 

(12) 了 解 外 设 向 CPU 提出 中 断 请 求 的 中 断 源 类 型 。 

(13) 了 解 CPU 查询 中 断 请 求 的 过 程 。 

(14) 理解 CPU 响应 中 断 的 3 个 条 件 。 

(15) 了 解 CPU 响应 中 断 请 求 的 过 程 。 

(16) 掌握 中 断 响应 隐 指 令 的 实现 方法 。 

(17) 掌握 调 出 中 断 服务 程序 的 方法 (软件 查询 或 形成 向 量 地 址 ) 。 

《18) 了 解 中 断 服务 程序 (中 断 处 理 过 程 ) 的 结构 框架 。 

(19) 理解 断 点 保护 和 现场 保护 之 间 的 不 同 。 

(20) 理解 为 何 需 要 进行 断 点 保护 和 恢复 并 了 解 其 实现 方法 。 
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《21) 了 解 中 断 允 许 触发 器 的 作用 以 及 应 在 何 时 开 / 关 中 断 。 
(22) 理解 中 断 服务 程序 调用 和 子 程序 调用 的 差别 。 

(23) 理解 中 断 接口 电路 (中 断 控 制 器 ) 的 结构 。 

(24) 理解 多 重 中 断 和 中 断 屏 项 的 概念 。 

(25) 了 解 获取 中 断 服务 程序 入 口 地 址 的 过 程 。 

(26) 理解 中 断 返 回 和 子 程序 返回 的 差别 。 

(27) 理解 为 什么 要 在 中 断 处 理 开 始 时 保护 现场 、 结 束 时 恢复 现场 。 
(28) 了 解 DMA 方式 适用 的 场合 和 特点 。 

(29) 了 解 DMA 接口 的 组 成 结构 。 

(30) 掌握 DMA 传送 过 程 。 

(31) 理解 中 断 方式 和 DMA 方式 的 差别 。 


输入 输出 组 织 主要 指 用 于 控制 外 设 与 主 存 、 外 设 与 CPU 之 间 进 行 数据 交换 的 软 、 硬 件 
系统 。 实 现 输入 输出 功能 的 关键 是 要 解决 以 下 一 系列 的 问题 : 如 何在 CPU.、 主 存 和 外 设 之 
间 建 立 一 个 高 效 的 信息 传输 “通路 ”; 怎 样 将 用 户 的 1/O 请 求 转换 成 对 设备 的 控制 命令 ;如 
何 使 CPU 方便 地 寻找 到 要 访问 的 外 设 ;IO 硬件 和 I/O 软件 如 何 协调 完成 主机 和 外 设 之 间 
的 数据 传送 等 。 因 此 ,本 章 的 内 容 应 围绕 这 些 问题 展开 讲解 。 

本 章 的 内 容 主 要 包括 常用 输入 /输出 设备 、 外 部 存储 设备 .I/O 接口 和 IO 数据 传输 控 
制 方式 这 4 个 方面 。 

对 于 常用 输入 /输出 设备 ,因为 设备 的 工作 原理 不 属于 主干 内 容 , 而 且 不 同 设备 的 工作 
原理 差别 较 大 ,所 以 ,在 课时 有 限 的 情况 下 ,关于 键盘 .鼠标 器 .打印 机 和 显示 器 等 的 工作 原 
理 可 以 跳 过 不 讲 。 但 是 ,如 果 学 生 对 I/O 设备 的 功能 和 结构 一 点 不 了 解 , 那 么 ,要 理解 后 续 
的 如 I/O 接口 等 内 容 就 比较 困难 ,因此 ,可 以 简单 讲解 TO 设备 的 通用 结构 ,以 便 让 学 生 明 
白 : 设备 与 计算 机 主机 之 间 有 数据 交换 ,如 键盘 和 了 鼠标 器 的 输入 信息 、 打 印 机 和 显示 器 的 输 
出 信息 等 ;计算 机 主机 会 向 设备 发 送 控 制 信息 ,如 打印 机 的 初始 化 、 选 通 、 自 动 走 纸 等 命令 ; 
设备 会 向 计算 机 主机 回 送 状态 信息 ,如 打印 机 忙 、 缺 纸 、 联 机 等 状态 信息 。 

对 于 外 部 存储 设备 ,因为 它 是 存储 器 分 层 体系 结构 中 的 一 个 重要 组 成 部 分 ,所 以 它 属于 
主干 内 容 ,特别 是 硬 磁盘 存储 器 , 它 与 操作 系统 中 的 存储 管理 .设备 管理 和 文件 系统 等 都 有 
很 大 的 关联 ,因此 ,本 课程 中 应 该 把 硬 磁盘 存储 器 讲 清楚 ,包括 : 性 能 指标 、 读 写 原理 、 硬 磁 
盘 驱动 器 的 内 部 结构 、 硬 磁盘 控制 器 的 结构 和 功能 、 磁 道 和 扇 区 记录 格式 等 。 关 于 元 余 磁 盘 
阵列 (RAID), 因 为 其 应 用 的 广泛 性 ,作为 计算 机 专业 的 学 生 必 须 对 其 有 一 定 的 了 解 ,在 课 
时 有 限 的 情况 下 ,可 以 把 RAID 技术 的 基本 思想 、 基 本 实现 原理 简单 介绍 一 下 。 对 于 U 盘 、 
移动 硬盘 、 固 态 硬盘 、 磁 带 存储 器 、 光 盘存 储 器 等 ,在 课时 有 限时 ,也 可 以 不 展开 来 细 讲 ,而 是 
主要 介绍 基本 原理 和 主要 使 用 场合 。 

对 于 I/O 接口 ,因为 不 同 设备 对 应 的 MO 接口 的 结构 相差 很 大 ,而 且 各 种 接口 的 类 型 
也 很 多 ,有 限 的 课时 无 法 讲 清 楚 所 有 1/O 接口 的 实现 细节 ,所 以 ,本 章 应 主要 关注 I/O 接口 
的 通用 结构 和 一 般 功 能 。 这 部 分 内 容 中 ,有 关 操 作 系 统 对 IO 的 支持 ,上 课时 可 以 跳 过 不 
讲 , 但 是 ,如 果 学 生 课 后 能 够 很 好 地 阅读 这 部 分 内 容 , 则 对 于 学 生理 解 用 户 程序 和 操作 系统 
之 间 的 关系 、 操 作 系统 和 硬件 之 间 的 关系 都 有 好 处 ,从 而 能 更 好 地 理解 计算 机 的 层次 化 结 
构 。 另 外 ,对 于 同步 串 行 通信 协议 .IO 接口 举例 (如 Intel 8255A 并 行 接口 .SCSI 总 线 式 并 
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行 接口 ) 的 内 容 也 都 可 以 跳 过 不 讲 , 而 作为 学 生 课 后 阅读 材料 ,让 学 生 了 解 一 些 实现 细节 ,来 
更 好 地 理解 基本 原理 。 

对 于 IO 传送 控制 方式 ,主要 要 求 对 程序 直接 控制 .中 断 和 DMA 三 种 基本 I/O 方式 有 
所 和 掌握。 有关 DMA 对 存储 系统 带 来 的 影响 ,可 以 不 展开 来 介绍 ,而 是 提出 问题 以 引起 学 生 
的 思考 。 对 于 通道 和 输入 /输出 处 理 机 方式 ,因为 不 是 目前 单 处 理 器 计算 机 系统 所 用 的 主流 
方式 ,所 以 细节 部 分 可 以 跳 过 不 讲 , 而 是 简单 说 明 一 下 基本 原理 妈 可 。 


9.2 主要 内 容 提要 


1， 外 部 设备 及 其 与 主机 的 互 连 

输入 设备 .输出 设备 和 外 存储 器 统称 为 外 部 设备 ,简称 外 设 。 像 键盘 鼠标、 针 式 打印 机 
等 设备 每 次 按 单个 数据 为 单位 进行 交换 ,属于 字符 型 设备 ;磁盘 光盘、 扫描 仪 等 设备 一 旦 被 
启动 后 ,每 次 都 会 交换 一 块 数据 ,因此 ,属于 成 块 传送 设备 。 

所 有 外 设 通 过 相应 的 电缆 (通信 和 总线 ) 连 到 I/O 接口 电路 上 ,I/O 接口 电路 再 通过 IO 
总 线 连 到 主板 上 ,最 终 通过 存储 器 总 线 和 处 理 器 总 线 与 主 存 和 CPU 相连 。 

2， 常用 输入 、 输 出 设备 

常用 的 输入 设备 有 键盘 鼠标 .扫描 仪 等 。 键 盘 通 过 串 行 方式 向 主机 输入 信息 ,通常 所 
用 的 键盘 为 非 编 码 键盘 ,从 键盘 送 到 主机 侧 键盘 接口 电路 中 的 是 按键 的 扫描 码 , 即 位 置 码 。 
鼠标 器 也 是 通过 串 行 方式 向 主机 传送 信息 ,输入 的 是 鼠标 移动 的 位 置信 息 。 

常用 的 输出 设备 有 打印 机 和 显示 器 等 。 打 印 机 有 针 式 、 激 光 和 喷 墨 3 类 ,它们 各 自 适用 
的 场合 不 同 , 所 用 的 打印 技术 也 不 一 样 。 激 光 打 印 机 比较 复杂 一 些 , 它 由 打印 控制 器 和 打印 
部 件 两 部 分 组 成 ,分 别 用 于 打印 控制 和 打印 。 打 印 控制 器 中 包含 功能 较 强 的 专门 用 于 打印 
控制 的 处 理 器 、 缓 冲 存 储 器 和 其 他 辅助 电路 ,可 实现 对 打印 语言 的 解释 \ 页 面 内 容 的 格式 化 
和 光栅 化 (转换 为 点 阵 数据 ) 等 处 理 。 显 示 器 有 CRT\ 液 晶 (LCD) 和 等 离子 显示 器 等 ,目前 
使 用 较 多 的 是 液晶 显示 器 。 显 示 器 显示 的 信息 是 离散 的 像素 点 ,显示 器 的 主要 参数 有 分 辩 
率 ., 行 频 、 帧 频 (刷新 频率 ) 等 。 屏 幕 上 的 点 的 颜色 用 R、G、B 三 个 分 量 来 表示 ,其 位 数 之 和 就 
是 颜色 深度 ,每 个 点 的 颜色 值 存 放 在 显示 存储 器 (VRAM, 显 存 ) 中 。 在 主机 和 显示 器 之 间 
有 一 个 显示 控制 器 ,可 集成 在 主板 上 ,也 可 以 以 显卡 的 形式 插 在 I/O 总 线 槽 中 。 显 存 通常 
集成 在 显卡 中 ,为 了 快速 处 理 3D 图 形 ,通常 在 显卡 中 配置 专门 用 作 图 形 处 理 的 绘图 处 理 器 
(GPU) ,此 时 ,显存 不 仅 用 来 存放 屏幕 位 图 信息 ,更 主要 的 是 用 来 存放 GPU 芯片 处 理 过 或 
者 即将 处 理 的 像素 数据 和 党 染 数据 。 

3. 常用 外 部 存储 器 

常用 外 部 存储 器 有 磁盘 、 闪 存盘 、 磁 带 库 和 光盘 库 。 磁 盘 主 要 用 作 主 存 的 辅助 存储 器 ， 
存放 计算 机 系统 的 所 有 信息 ;闪存 盘 以 U 盘 、 外 接 硬盘 或 内 装 的 固态 硬盘 形式 出 现 ; 磁 带 库 
和 光盘 库 主 要 用 作 备 份 数据 的 后 备 存储 器 。 

磁盘 和 磁带 都 是 磁 表 面 存储 器 ,其 基本 存储 原理 一 样 。 磁 盘存 储 器 的 主要 技术 指标 
如 下 。 

(1) 记录 密度 : 道 密度 指 单位 长 度 上 的 磁道 数 ; 位 密度 为 磁道 中 单位 长 度 上 的 位 数 。 

(2) 平均 存 取 时 间 : 平均 寻 道 时 间 和 平均 等 待 时 间 之 和 (数据 传输 时 间 相 对 较 小 ,可 忽 
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略 不 计 ) 。 平 均 寻 道 时间 指 移动 磁头 到 所 读 写 磁道 的 平均 时 间 ; 平 均等 待 时 间 指 要 读 写 的 扇 
区 旋转 到 磁头 下 方 所 需要 的 平均 时 间 ,等 于 磁盘 旋转 一 圈 所 花 时 间 的 一 半 。 

《3) 数据 传输 率 : 分 为 内 部 数据 传输 率 和 外 部 数据 传输 率 。 内 部 数据 传输 率 与 磁盘 转 
速 有 关 , 指 寻 道 和 旋转 等 待 后 ,单位 时 间 内 从 存储 介质 上 读 出 或 写 人 的 二 进 制 信息 量 。 外 部 
数据 传输 率 与 磁盘 转速 无 关 , 指 磁盘 接口 (磁盘 控制 器 ) 和 磁盘 缓存 之 间 进 行 数据 交换 的 数 
据 传输 率 。 外 部 数据 传输 速率 比 内 部 数据 传输 速率 高 得 多 。 

4， 元 余 磁盘 阵列 RAID 

RAID 技术 的 主要 实现 思想 是 通过 多 个 物理 盘 的 交叉 存储 和 访问 ,提高 访问 速度 ,并 增 
加 存储 容量 ;同时 ,通过 在 盘 上 增加 校 验 信息 ,以 提高 磁盘 的 可 靠 性 。 根 据 交 叉 存 储 块 大 小 
的 不 同 , 可 以 有 小 条 带 方式 和 大 条 区 方式 。 对 于 小 条 带 分 布 方式 ,因为 一 个 I/O 请 求 分 布 
在 所 有 物理 盘 中 ,而 所 有 盘 都 可 以 并 行 访问 ,所 以 其 数据 传输 率 比 单个 盘 的 情况 要 高 很 多 
倍 , 因 而 适用 于 流 媒 体 播放 系统 ;对 于 大 条 区 分 布 方 式 , 因 为 每 个 交叉 存储 的 数据 块 较 大 ,使 
得 小 数据 量 的 1/O 请 求 只 访问 一 个 物理 盘 ,多 个 物理 盘 可 以 响应 多 个 I/O 请求 ,所 以 其 1/O 
响应 速度 较 快 ,适用 于 银行 、 证 券 等 事务 处 理 系 统 。 

RAID 级 别 有 RAID0~RAID7, 并 派生 出 了 RAID10、RAID30 和 RAID50 等 。 目 前 广 
泛 使 用 的 是 RAIDO、RAID1 和 RAID5 等 。 

5. JIVO 接口 的 职能 、 结 构 和 类 型 

IO 接口 是 用 于 连接 主机 和 外 设 并 通过 接受 主机 命令 来 对 外 设 进行 控制 的 部 件 的 总 
称 。 例 如 ,显卡 、 网 卡 \. 打 印 控制 器 .磁盘 控制 器 等 都 属于 I/O 接口 ,有 时 也 称 为 I/O 模块 。 

不 同 设备 对 应 的 IO 接口 的 功能 不 完全 相同 ,其 逻辑 结构 也 不 一 样 。 但 是 ,所 有 IO 
接口 的 基本 结构 和 职能 是 类 似 的 。1/O 接口 中 ,有 用 于 存放 输入 /输出 数据 的 数据 缓冲 器 、 
用 于 记录 设备 或 接口 状态 的 状态 寄存 器 .用 于 存放 控制 信息 的 命令 (控制 ) 寄 存 器 等 ,这 些 寄 
存 器 分 别称 为 数据 端口 ,状态 端口 和 命令 (控制 ) 端 口 。L/O 接口 在 主机 一 侧 ,通过 I/O 总 线 
与 主机 相连 ,在 外 设 一 侧 通 过 通信 总 线 (电缆 ) 与 外 设 相连 。 通 常 /O 总线 和 通信 总 线 的 数 
据 宽 度 不 同 , 因 此 ,在 主机 侧 和 外 设 侧 的 数据 宽度 不 一 样 ,因而 在 I/O 接口 中 需要 有 进行 数 
据 格式 转换 的 逻辑 电路 ,此 外 ,还 需 在 主机 侧 和 外 设 侧 分 别 有 相 应 的 总 线 接口 逻辑 ,以 支持 
与 /0 总 线 和 通信 总 线 的 连接 。 

IO 接口 的 类 型 多 种 多 样 。 按 设备 侧 能 同时 传输 的 位 数 来 分 ,有 并 行 接口 和 串 行 接口 ， 
按 是 否 可 以 编程 控制 来 分 ,有 可 编程 接口 和 不 可 编程 接口 ; 按 是 否 支 持 标准 的 通信 总线 来 
分 ,有 通用 接口 和 专用 接口 ; 按 I/O 方式 来 分 ,有 无 条 件 查询 接口 ,条 件 查询 接口 .中 断 控 制 
器 接口 .DMA 控制 器 接口 ; 按 连 接 方式 来 分 ,有 点 对 点 接口 和 多 点 总 线 式 接口 。 

6. 1/O 端口 及 其 编 址 

IO 端口 指 1/O 接口 中 程序 可 访问 的 寄存 器 ,有 数据 端口 、 命 令 端口 和 状态 端口 。 通 常 
用 户 程 序 不 访问 这 些 I/O 端口 ,而 由 操作 系统 中 的 驱动 程序 访问 。 为 了 使 指令 能 够 访问 到 
I/O 端口 ,需要 对 它们 进行 编号 , 称 为 IO 端口 编 址 (有 时 称 为 设备 编 址 ,实际 上 并 不 是 对 设 
备 编 址 ) 。 

有 独立 编 址 和 统一 编 址 两 种 方式 。 独 立 编 址 方式 下 ,对 IO 端口 单独 编号 ,使 它们 成 
为 一 个 独立 的 I/O 地 址 空间 ,此 时 ,I/O 端口 号 可 能 和 主 存单 元 号 相同 ,因此 ,从 地 址 形式 上 
无 法 区 分 指令 访问 的 是 1/O 端口 还 是 主 存单 元 ,需要 通过 不 同 的 操作 码 来 区 分 ,因而 需要 
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提供 专门 的 IO 指令 来 控制 对 IO 端口 的 访问 。 统 一 编 址 方式 下 ,1/O 端口 与 主 存 地 址 空 
间 统 一 编号 ,将 主 存 地 址 空间 分 出 一 部 分 地 址 编号 给 IO 端口 进行 编号 ,因此 ,也 称 为 存储 
器 映射 方式 。 因 为 主 存单 元 和 I/O 端口 在 同一 个 地 址 空间 ,所 以 , 主 存单 元 号 和 I/O 端口 
号 肯定 不 会 相同 ,它们 分 属 两 个 不 同 的 地 址 范围 ,因此 ,通过 指令 给 出 的 地 址 范围 就 可 以 确 
定 访问 的 是 主 存单 元 还 是 I/O 端口 ,因而 指令 系统 无 须 提供 专门 的 1/O 指令 。 

7. 常用 I/O 控制 方式 

目前 , 单 处 理 器 计算 机 系统 中 常用 的 IO 方式 有 程序 直接 控制 .中 断 控 制 和 DMA 控制 
3 种 。 

程序 直接 控制 方式 分 无 条 件 传 送 和 条 件 传送 方式 。 无 条 件 传 送 方式 利用 程序 定时 传送 
数据 ,无须 检测 接口 或 设备 的 状态 ,适合 各 类 巡回 检测 或 过 程控 制 ; 条 件 传送 方式 也 称 为 程 
序 查 询 方式 ,CPU 通过 查询 外 设 接口 中 的 “就 绪 (Ready)”“ 忙 (Busy)” 和 “完成 (Done)” 等 
状态 来 控制 数据 的 传送 ,有 定时 查询 和 独占 查询 两 种 ,独占 查询 方式 下 ,CPU 在 整个 数据 交 
换 过 程 中 ,一 直 为 设备 的 I/O 服务 。 

中 断 控 制 方式 也 是 一 种 通过 执行 程序 来 进行 数据 交换 的 I/O 方式 。 当 外 设 准备 好 数 
据 或 准备 好 接收 新 数据 或 发 生 了 特殊 事件 时 ,外 设 通 过 向 CPU 发 中 断 请 求 来 使 CPU 转 到 
相应 的 中 断 服务 程序 去 执行 ,在 中 断 服务 程序 中 完成 数据 交换 或 处 理 特殊 事件 。 中 断 方式 
下 ,由 硬件 和 软件 共同 完成 整个 中 断 过 程 。 首 先 ,由 1/O 接口 向 CPU 发 中 断 请 求 ,CPU 每 
执行 完 一 条 指令 都 去 采样 中 断 请 求 线 ,一 旦 发 现 有 中 断 请 求 ,并 且 处 于 “ 开 中 断 ( 中 断 允 许 )” 
状态 ,CPU 就 进入 “中 断 响 应 ”周期 ,自动 执行 一 条 隐 指 令 , 完 成 关中 断 \ 保 护 断 点 、 识 别 中 断 
源 3 项 任务 ,识别 中 断 源 的 结果 就 是 将 中 断 服 务 程序 的 首 地 址 送 到 PC 中 。“ 中 断 响 应 ”周期 
结束 ,CPU 就 根据 PC 的 值 开始 执行 中 断 服务 程序 。 对 于 单 级 中 断 系 统 ,中 断 服务 程序 执 
行 过 程 中 一 直 不 会 开 中 断 ,直到 中 断 返 回 前 才 执 行 “ 开 中 断 ” 指 令 ; 而 对 于 多 级 中 断 系 统 , 中 
断 处 理 过 程 可 能 被 其 他 新 中 断 打 断 , 是 否 允 许 打 断 ,通过 在 每 个 中 断 服务 程序 中 设置 中 断 屏 
蔽 字 来 实现 ,中 断 服务 程序 中 还 要 进行 现场 的 保护 和 恢复 。 

DMA 控制 方式 适合 像 磁盘 一 类 的 高 速 设备 以 成 批 方式 和 主 存 直 接 交换 数据 。 首 先 要 对 
DMA 控制 器 进行 初始 化 ;然后 由 DMA 控制 器 控制 总 线 在 主 存 和 高 速 设备 之 间 进 行 直 接 数 据 
交换 ;最 后 ,DMA 控制 器 发 出 *DMA 传送 结束 ”信和 号 给 外 设 接口 ,由 外 设 接口 发 中 断 请 求 给 
CPU, 由 CPU 执行 相应 的 中 断 服 务 程序 来 进行 数据 校 验 等 ,最 终 完成 DMA 传送 处 理 。 


9.3 基本 术语 解释 


I/O 带宽 (I/O Bandwidth) 

单位 时 间 内 系统 输入 /输出 的 数据 量 或 所 完成 的 IO 操作 次 数 。 即 指 在 一 定时 间 内 所 
完成 的 工作 量 , 也 称 为 吞吐 率 (Throughput) 。 

响应 时 间 (Response Time) 

也 称 等 待 时 间 (Latency) ,是 指 从 作业 (或 1/O 请 求 ) 提 交 开 始 到 作业 (或 1/O 操作 ) 完 成 
所 用 的 时 间 。 

外 设 (Device) 

外 部 辅助 存储 器 和 输入 设备 、 输 出 设备 统称 为 外 设 。 也 称 为 外 围 设备 、 外 部 设备 或 I/O 
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设备 。 

输入 设备 (Input Device) 

输入 设备 的 作用 是 将 程序 、 原 始 数据 文字 、 图 像 .控制 命令 或 现场 采集 的 数据 等 信息 输 
人 到 计算 机 。 常 见 的 输入 设备 有 键盘 、 鼠 标 器 .扫描 仪 等 。 

输出 设备 (Output Device) 

输出 设备 把 计算 机 的 中 间 结 果 或 最 后 结果 、 机 内 的 各 种 数据 符号 及 文字 或 各 种 控制 信 
号 等 信息 以 某 种 形式 输出 到 计算 机 外 部 。 常 用 的 输出 设备 有 显示 终端 (CRT/LCD)、 打 印 
机 、 绘 图 仪 等 。 

存储 设备 (Storage Device) 

各 种 外 部 存储 器 称 为 存储 设备 ,可 以 把 信息 从 存储 设备 输入 到 主 存 , 也 可 以 把 主 存 中 的 
信息 输出 到 存储 设备 上 保存 。 如 软盘 、 磁 盘 、 光 盘 、 磁 带 等 。 

终端 (Terminal) 

传统 终端 是 指 一 种 计算 机 外 部 设备 ,现在 的 终端 概念 已 定位 到 一 种 由 CRT 显示 器 、 控 
制 器 及 键盘 合 为 一 体 的 设备 , 它 与 平常 指 的 微型 计算 机 的 根本 区 别 是 没有 自己 的 中 央 处 理 
单元 (CPU) ,当然 也 没有 自己 的 内 存 , 其 主要 功能 是 将 键盘 输入 的 请 求 数据 发 往 主机 (或 打 
印 机 ) 并 将 主机 运算 的 结果 显示 出 来 。 对 互联 网 而 言 ,终端 泛 指 一 切 可 以 接 人 网 络 的 计算 设 
备 ,如 个 人 计算 机 、 网 络 电 视 、 可 上 网 手机 、PDA 等 。 

磁道 (Track) 

磁盘 在 高 速 旋转 时 ,磁头 对 于 磁盘 表面 做 相对 运动 。 相 对 运动 时 磁头 在 盘面 上 所 经 过 
的 路 径 构成 一 个 磁道 。 磁 头 在 不 同 的 位 置 ,磁盘 表面 就 形成 不 同 半 径 的 同心 圆 ,因此 ,每 个 
同心 圆 为 一 个 磁道 。 每 个 磁道 都 有 一 个 编号 ,最 外 面 的 是 0 磁道 。 

柱 面 (Cylinder) 

在 一 个 磁盘 驱动 器 中 的 若干 个 盘 片 都 连 到 同一 个 中 心 轴 上 ,每 个 可 读 写 的 盘面 上 都 有 
一 个 磁头 ,这 些 磁头 被 连 在 一 起 且 同 时 按 相 同 的 轨迹 移动 。 因 此 ,在 不 同 盘面 上 的 磁头 总 是 
处 在 相同 半径 的 磁道 上 ,所 有 盘面 上 的 这 些 磁道 构成 一 个 柱 面 。 因 此 , 柱 面 号 和 磁道 号 是 一 
样 的 。 磁 头号 和 盘面 号 是 一 样 的 。 

扇 区 (Sector) 

每 个 磁道 被 划分 为 若干 段 ,又 叫 扁 区 ,每 个 扁 区 的 存储 容量 均 为 512 字 节 或 4096 字 节 。 
每 个 扇 区 都 有 一 个 编号 , 扁 区 是 磁盘 的 最 小 编 址 单位 。 因 此 ,到 磁盘 上 寻找 数据 时 ,只 需 定 
位 到 相应 的 扇 区 。 读 写 数据 时 可 能 会 以 多 个 扇 区 为 单位 进行 传输 。 

道 密度 (Track Density) 

沿 磁盘 半径 方向 单位 长 度 上 的 磁道 数 称 为 道 密度 。 道 密度 的 单位 是 道 /英寸 (英文 表示 
为 TPI, 是 Tracks Per Inch 的 缩写 ) 或 道 /毫米 (TPM)。 道 密度 是 相 邻 磁道 间距 的 倒数 。 

位 密度 (Bit Density) 

磁道 上 单位 长 度 所 记录 的 二 进 制 信息 位 叫 位 密度 或 线 密度 ,早期 的 磁盘 ,每 个 磁道 所 含 
信息 量 一 样 。 这 样 的 磁盘 因为 周 长 不 同 ,其 每 个 磁道 的 位 密度 也 不 同 。 一 般 磁 盘 的 位 密度 
是 指 最 内 图 上 的 位 密度 。 单 位 是 位 /英寸 或 位 /毫米 。 现 在 也 有 一 些 磁盘 的 磁道 采用 变 长 方 
式 记录 信息 ,外 轿 上 的 磁道 可 以 比 内 圈 上 的 磁道 多 记录 一 些 信息 。 

磁盘 平均 存 取 时 间 (Average Access Time) 

操作 系统 必须 通过 3 个 步骤 对 磁盘 进行 操作 : 寻 道 (Seek)、 旋 转 (Rotation) ` 读 写 数据 。 


激 信 符 让 想 因 ， 


因为 读 写 数据 所 用 时 间 相 对 于 前 两 个 操作 而 言 , 可 以 忽略 不 计 , 所 以 ,通常 将 前 两 个 操作 时 
间 的 平均 值 之 和 称 为 磁盘 平均 存 取 时 间 。 即 平均 存 取 时 间 等 于 平均 寻 道 时 间 加 平均 旋转 
时 间 。 

平均 寻 道 时 间 (Average Seek Time) 

移动 磁头 ,使 磁头 定位 到 要 读 写 的 磁道 上 的 操作 称 为 寻 道 (Seek)。 平 均 寻 道 时 间 取 决 
于 相 邻 两 道 之 间 的 寻 道 时 间 , 称 为 道 间 移 动 时 间 , 工 业 上 也 把 它 称 为 最 小 寻 道 时 间 。 平 均 寻 
道 时 间 有 很 多 种 测量 方法 ,最 简单 的 方法 就 是 把 最 长 寻 道 时 间 除 以 2。 最 长 寻 道 时 间 就 是 
从 最 内 (外 ) 移 过 所 有 磁道 到 最 外 (内 ) 磁 道 的 时 间 。 

平均 旋转 时 间 (Average Rotational Latency/Delay ) 

磁头 定位 在 要 读 写 的 磁道 后 ,磁盘 开始 旋转 直到 磁头 正好 落 在 要 读 写 的 数据 上 方 。 通 
常 把 完成 这 个 过 程 的 时 间 称 为 旋转 (等 待 ) 时 间 。 平 均 旋转 时 间 是 磁盘 转 一 圈 的 时 间 的 
一 半 。 

传输 时 间 (Transfer Time) 

当 磁 头 正好 落 在 要 读 写 数据 的 起 点 后 ,就 开始 读 / 写 数 据 , 磁 盘 读 / 写 一 块 数据 (一 个 遍 
区 ) 的 时 间 为 传输 时 间 。 它 是 扇 区 大 小 、 旋 转速 度 、 磁 道上 位 密度 的 函数 。 

磁盘 数据 传输 率 (Transfer Rate) 

分 为 外 部 数据 传输 率 和 内 部 数据 传输 率 两 种 。 外 部 数据 传输 率 指 主机 接口 从 (向 ?硬盘 
缓存 读 出 ( 写 人 ) 数 据 的 速度 ;内 部 数据 传输 率 指 读 写 磁头 定位 在 要 读 写 的 数据 块 的 始 端 后 ， 
单位 时 间 内 连续 从 磁道 中 读 出 或 写 人 的 二 进 制 数据 的 位 数 。 

磁盘 控制 器 (Disk Controller) 

指 用 来 控制 磁盘 进行 数据 读 写 ,并 控制 数据 在 磁盘 和 主 存 间 进 行 传输 的 部 件 。 因 
此 ,一 次 磁盘 读 写 操 作 除了 和 寻 道 .旋转 、 传 输 3 个 操作 时 间 以 外 ,还 要 加 上 磁盘 控制 器 所 
用 的 时 间 。 

廉价 磁盘 元 余 阵列 (Redundant Arrays of Inexpensive Disk, RAID) 

将 多 个 独立 操作 的 磁盘 按 某 种 方式 组 织 成 磁盘 阵列 ,以 增加 容量 ,利用 类 似 于 主 存 中 的 
多 体 交叉 技术 ,将 数据 存储 在 多 个 盘 上 ,通过 使 这 些 盘 并 行 工 作 来 提高 数据 传输 速度 ,并 用 
元 余 磁盘 技术 提高 系统 可 靠 性 。 

1/O 接口 (I/O Interface,I/O Module) 

I/O 接口 (IO 模块) 是 主机 和 外 设 之 间 传 送信 息 的 “桥梁 ”, 介 于 主机 和 外 设 之 间 。 主 
机 控制 外 设 的 命令 信息 、 传 送 给 外 设 的 数据 或 从 外 设 取 来 的 数据 、 外 设 送 给 主机 的 状态 信息 
等 都 要 先 存放 到 I/O 接口 。 对 每 种 具体 的 设备 来 说 ,就 是 介 于 底板 总 线 和 通信 总 线 (电缆 
式 总 线 ) 之 间 的 扩展 卡 或 插件 板 , 例 如 ,网 卡 、 显 示 卡 等 。 也 有 很 多 设备 的 接口 电路 集成 在 主 
板 上 ,如 声卡 .Modem 卡 、 打 印 机 控制 卡 、 磁 盘 控制 器 、 键 盘 / 鼠 标 控制 电路 等 已 经 基本 上 集 
成 在 主板 上 ,只 留 一 些 电 缆 插座 ,以 连接 相应 的 外 部 设备 。 

1/0 控制 器 (IO Controller) 

IO 接口 中 的 控制 电路 ,不 包含 IO 接口 中 的 连接 器 插座 。 

I/O 端口 (I/O Port) 

I/O 接口 中 一 些 可 被 程序 访问 的 寄存 器 ,用 来 存放 控制 (命令 ) 、 数 据 和 状态 信息 ,这 些 
寄存 器 被 称 为 1/O 端口 。 
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命令 (控制 ) 端 口 (Command/Control Port) 

在 IO 接口 中 ,用 来 存放 CPU 送 来 的 控制 信息 的 寄存 器 称 为 命令 端口 或 控制 端口 ,只 
可 以 对 其 进行 写 操作 。 

数据 端口 (Data Port) 

在 IO 接口 中 ,用 于 存放 接收 和 发 送 数据 的 寄存 器 称 为 数据 端口 ,可 以 对 其 进行 读 或 
写 操作 。 

状态 端口 (Status Port) 

在 IO 接口 中 ,用 来 记录 设备 或 IO 接口 的 状态 的 寄存 器 称 为 状态 端口 ,通常 只 可 以 
对 其 进行 读 操作 。 有 些 接口 电路 ,将 命令 端口 和 状态 端口 合 二 为 一 ,作为 命令 端口 时 ,从 
CPU 写 人 控制 信息 ,作为 状态 端口 时 , 存 人 外 设 或 接口 的 状态 信息 , 供 CPU 读 取 。 

I/O 地 址 空间 (I/O Address Space) 

所 有 I/O 端口 号 组 成 的 地 址 空间 ,也 简称 为 I/O 空间 。 

独立 编 址 (Special Address Space) 

将 W/O 端口 和 主 存单 元 分 别 编 号 ,不 占用 主 存单 元 的 地 址 空间 ,因而 主 存单 元 和 1/O 
端口 可 能 会 有 相同 的 编号 ,但 地 址 位 数 大 多 不 同 , 主 存单 元 多 ,地 址 空间 大 ,因而 地 址 位 数 
多 ;I/O 端口 少 , 地 址 空间 小 ,因而 地 址 位 数 少 。 因 为 可 能 有 相同 的 编号 ,指令 中 无 法 靠 地 址 
来 区 分 要 访问 的 是 主 存单 元 还 是 I/O 端口 ,所 以 ,需要 有 和 访 存 指令 不 同 的 操作 码 , 因 此 ， 
需要 设计 专门 的 IO 指令 。 

统一 编 址 (United Address Space) 

IO 端口 和 主 存单 元 统一 编 址 ,所 以 也 称 为 存储 器 映射 IO(Memory-mapped IO) 方 
式 。 一 个 地 址 空间 分 成 了 两 部 分 ,各 在 不 同 的 地 址 范围 内 ,但 地 址 的 位 数 是 相同 的 ,可 根据 
地 址 范围 的 不 同 来 区 分 访问 的 是 主 存单 元 还 是 W/O 端口 ,所 以 无 须 专门 地 输入 输出 指令 。 

并 行 接口 (Parallel Interface) 

并 行 接口 在 设备 和 接口 之 间 同 时 传送 一 个 字 节 或 一 个 字 的 所 有 位 。 

串 行 接口 (Serial Interface) 

串 行 接口 在 设备 和 接口 之 间 按 位 来 传送 数据 。 

可 编程 接口 (Programmable Interface) 

能 用 程序 来 改变 或 选择 接口 的 功能 和 操作 方式 。 

不 可 编程 接口 (Non-programmable Interface) 

不 能 用 程序 来 改变 其 功能 和 操作 方式 ,但 可 通过 硬 连 线路 来 实现 不 同 的 功能 。 

1/O 指令 (I/O Instruction) 

指 用 来 访问 I/O 端口 的 指令 。 指 令 中 的 操作 码 必 须 指出 是 读 还 是 写 , 地 址 码 必 须 说 明 
信息 在 哪个 端口 和 哪个 通用 寄存 器 之 间 进 行 传送 ,所 以 ,地 址 码 中 要 给 出 端口 号 和 通用 寄存 
器 编号 。 如 80x86 中 的 IN 指令 和 OUT 指令 等 。 

在 具有 通道 的 大 型 机 中 ,CPU 通过 通道 控制 外 设 , 此 时 I/O 指令 是 指控 制 通道 和 外 设 
控制 器 的 指令 。 如 START I/O、TEST I/O、HALT IO 指令 等 。 

程序 查询 IO 方式 (1/O Polling) 

CPU 通过 执行 查询 程序 来 完成 对 外 设 的 控制 ,并 实现 和 外 设 之 间 的 数据 传送 。 在 查询 
程序 中 ,CPU 首先 通过 读 取 状态 端口 中 的 状态 信息 ,了 解 接口 是 否 已 “就 绪 ”( 或 “完成 ”) ,是 
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的 话 就 通过 数据 端口 进行 新 的 数据 传送 ,并 查询 外 设 是 否 空闲 ,在 外 设 空闲 的 情况 下 ,通过 
发 送 控 制 信息 到 命令 端口 ,然后 由 接口 发 “启动 ”命令 送 外 设 ; 如 果 接 口 没有 就 绪 , 或 外 设 不 
空闲 , 则 CPU 继续 查询 ,以 等 待 接口 就 绪 或 外 设 空闲 。 所 有 信息 (包括 : 控制 .数据 和 状态 
信息 ) 的 交换 由 查询 程序 中 的 IO 指令 完成 。 

就 绪 状 态 (Ready) 

对 于 输入 设备 而 言 ,就 绪 状 态 意 味 着 I/O 接口 中 的 数据 缓冲 器 的 数据 已 有 效 ,CPU 可 
以 从 IO 接口 取 数 据 ;对 于 输出 设备 而 言 , 则 说 明 1/O 接口 中 的 数据 缓冲 器 已 空 ,CPU 可 以 
将 数据 送 到 IO 接口 中 。 

程序 中 断 I/O 方式 (1/O Interrupt) 

程序 中 断 IO 方式 下 ,CPU 启动 外 设 后 ,就 转 到 另外 一 个 程序 执行 ,此 时 ,外 设 和 CPU 
并 行 工作 。 一 旦 外 设 完成 任务 , 便 发 中 断 请 求 给 CPU ,告知 CPU 刚才 所 请 求 的 1/O 任务 已 
经 完成 。 此 时 ,CPU 暂停 正在 执行 的 程序 , 转 到 一 个 中 断 服务 程序 进行 中 断 处 理 , 在 中 断 处 
理 过 程 中 ,进行 外 设 I/O 下 一 步 的 准备 工作 (如 : 传送 下 一 个 要 打印 的 数据 ; 取 走 键盘 数据 
或 采样 数据 ,为 下 次 输入 腾空 数据 缓冲 寄存 器 ;等 等 ), 最 后 启动 外 设 , 并 回 到 原 程序 继续 执 
行 。 此 时 ,CPU 和 外 设 又 能 并 行 工作 。 

可 屏蔽 中 断 (Maskable Interrupt) 

如 果 某 个 中 断 事件 不 是 很 紧急 ,可 以 被 延缓 响应 ,那么 在 处 理 其 他 中 断 时 ,就 可 以 屏蔽 
这 个 中 断 , 让 正在 处 理 的 中 断 执行 完 后 ,再 来 响应 这 个 中 断 。 这 种 称 为 可 屏 项 中断。 一 般 外 
设 中 断 源 引起 的 中 断 都 是 可 屏 项 中 断 。 

不 可 屏蔽 中 断 (Non-maskable Interrupt, NMI) 

不 可 屏 项 中 断 是 指 重要 或 紧急 的 硬件 故障 事件 ,如 电源 掉 电 存储 器 线路 出 错 等 。 这 类 
中 断 发 生 时 ,必须 立即 响应 ,不 能 把 这 类 中 断 屏蔽 掉 。 

中 断 请 求 寄 存 器 (Interrupt Request Register) 

中 断 控制 器 中 专门 用 来 存放 每 个 设备 对 应 的 中 断 请 求 信号 的 寄存 器 。 

中 断 屏 茂 寄存 器 (Interrupt Mask Register) 

中 断 控制 器 中 专门 用 来 存放 每 个 中 断 源 对 应 的 中 断 屏蔽 字 的 寄存 器 。 

中 断 响 应 优先 级 (Interrupt Response Priority) 

中 断 响 应 优先 级 是 指 当 多 个 中 断 请 求 发 生 时 ,优先 响应 哪个 中 断 请 求 。 它 是 由 硬件 排 
队 线 路 或 中 断 查 询 程序 的 查询 顺序 决定 的 ,不 可 动态 改变 。 

中 断 处 理 优先 级 (Interrupt Process Priority) 

中 断 处 理 优先 级 反映 的 是 正在 处 理 的 中 断 是 否 比 新 发 生 的 中 断 的 处 理 优 先 级 低 ( 即 ， 
屏蔽 位 为 “0”, 对 新 中 断 开 放 ) ,如 果 是 的 话 , 就 中 止 正在 处 理 的 中 断 , 转 到 新 的 中 断 服务 程 
去 执行 ,处 理 完 后 回 到 原 被 中 止 的 中 断 服务 程序 继续 执行 。 中 断 处 理 优先 级 可 以 由 中 断 
项 字 来 动态 改变 。 

DMA( 直 接 存 储 器 存 取 )1/O 方式 (Direct Memory Access) 

DMA 是 Direct Memory Access 的 缩写 。 每 次 需要 进行 外 设 数 据 读 写 时 ,首先 CPU 把 
要 传送 的 数据 个 数 \ 数 据 块 在 内 存 的 首 址 、 数 据 传送 的 方向 (是 读 操作 还 是 写 操 作 )、 设 备 的 
地 址 等 参数 送 给 DMA 控制 器 ,最 后 发 送 一 个 命令 给 DMA 接口 ,以 启动 外 设 进行 数据 传 
送 。 在 这 些 工 作 完成 后 ,CPU 就 继续 进行 其 他 工作 。 此 时 ,CPU 和 外 设 并 行 工 作 , 而 外 设 
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和 主 存 交换 数据 的 工作 就 交 给 DMA 控制 器 控制 完成 。DMA 控制 器 在 需要 时 申请 总 线 控 
制 权 ,占用 总 线 完 成 外 设 和 主 存 间 的 数据 传送 。 传 送 结束 后 ,向 CPU 发 送 “DMA 结束 ”中 
断 请 求 , 让 CPU 进行 数据 校 验 等 后 处 理工 作 。 

DMA 方式 适合 像 磁 盘 一 类 的 高 速 设备 ,以 成 批 的 方式 和 主 存 直 接 交 换 数据 。 

周期 挪用 (Cycle Stealing) 

周期 挪用 法 的 基本 思想 是 , 当 外 设 准 备 好 一 个 数据 时 , DMA 控制 器 就 向 CPU 申请 一 
次 总 线 控制 权 ,CPU 在 一 次 总 线 操作 结束 时 一 旦 发 现 有 DMA 请 求 , 就 立即 释放 总 线 ,让 出 
一 个 周期 给 DMA 控制 器 ,由 DMA 控制 器 控制 总 线 在 主 存 和 外 设 之 间 传 送 一 个 数据 ,传送 
结束 后 立即 释放 总 线 , 下 次 外 设 准备 好 数据 时 ,又 重复 上 述 过 程 ,直到 所 有 数据 传送 完毕 。 
在 这 种 情况 下 ,CPU 的 工作 几乎 不 受 影响 ,只 是 在 万 一 出 现 访 存 冲 突 ( 即 CPU 和 DMA 控 
制 器 同时 要 求 访问 同一 个 主 存 ) 时 ,CPU 挪 出 一 个 周期 给 DMA ,由 DMA 访问 主 存 , 而 CPU 
延迟 访问 主 存 。 这 里 CPU 挪用 的 是 主 存 存 取 周 期 。 

DMA 控制 器 (DMA Controller) 

把 DMA 接口 中 控制 数据 传送 的 硬件 逻辑 称 为 DMA 控制 器 。 它 能 像 CPU 一 样 控制 
总 线 , 完 成 IO 设备 和 主 存 间 的 数据 传送 。 

通道 CChannel,CH) 

通道 是 用 来 负责 管理 外 设 以 及 实现 主 存 和 外 设 之 间 数 据 交 换 的 一 种 专门 的 控制 部 件 。 
通道 能 够 执行 专门 的 通道 指令 ,若干 条 通道 指令 组 成 一 个 通道 程序 ,通过 执行 通道 程序 进行 
I/O 操作 。CPU 通过 执行 专门 的 1/O 指令 来 启动 ,停止 通道 ,或 测试 或 改变 通道 工作 状态 ， 
而 不 直接 参与 对 外 设 的 管理 和 控制 。 

通道 指令 (Channel Command) 

又 称 为 通道 控制 字 (Channel Control Word,CCW) ,是 为 通道 专门 设计 的 用 于 IO 的 指令 。 
一 个 通道 控制 字 一 般 包 括 操作 命令 码 \ 数 据 在 内 存 的 首 址 、 传 送 数据 个 数 和 控制 标志 字段 等 。 

输入 /输出 处 理 机 (I/O Processor) 

输入 /输出 处 理 机 方式 是 通道 方式 的 进一步 发 展 , 有 两 种 输入 /输出 处 理 机 系统 结构 。 
一 种 是 通道 结构 的 输入 /输出 处 理 机 ,通常 称 为 IO 处 理 机 (IOP)。 男 一 种 输入 /输出 处 理 
机 系统 结构 是 外 围 处 理 器 (PPU) 方 式 。 在 大 型 计算 机 系统 中 ,有 时 选用 通用 计算 机 担任 
PPU, 它 基本 上 独立 于 主 CPU 而 工作 ,也 有 自己 的 指令 系统 ,可 进行 算术 /逻辑 运算 、 主 存 
读 写 和 与 外 设 交换 信息 等 。 


9.4 常见 问题 解答 


1. IO 设备 和 1/O 接口 两 部 分 结合 起 来 就 是 输入 输出 系统 玛 ? 

答 : 不 是 。IO 设备 和 LI/O 接口 只 是 IO 硬件 部 分 ,输入 输出 系统 应 该 包括 1/O 硬件 
和 I/O 软件 两 个 部 分 。 不 同 硬件 结构 的 I/O 系统 ,所 采用 的 I/O 软件 技术 差别 很 大 。 但 不 
管 是 哪 种 ,CPU 通过 直接 执行 1/O 指令 或 操作 系统 管理 程序 ,总 是 或 多 或 少 地 参与 主机 和 
外 设 交换 信息 的 任务 ,也 就 是 说 输入 /输出 任务 总 要 有 IO 软件 的 参与 。 

2. 1/O 系统 的 性 能 如 何 评价 ? 

答 : 一 般 用 响应 时 间 和 吞吐 率 两 个 指标 来 衡量 。 不 同 的 1/O 系统 对 于 响应 时 间 和 吞吐 
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率 的 要 求 不 同 。 例 如 ,对 于 事务 处 理 系统 (如 : 订 票 、 存 /取款 等 系统 ) ,由 于 同时 会 有 有 大量 的 
事务 要 求 处 理 ,日 每 个 事务 对 磁盘 的 访问 量 很 少 ,所 以 这 种 系统 主要 考虑 每 秒 钟 磁盘 的 存 取 
次 数 能 否 达 到 很 大 ,使 得 同时 有 很 多 事务 在 很 短 的 时 间 内 得 到 快速 响应 。 也 就 是 说 ,对 响应 
时间 的 要 求 更 高 ,而 不 大 在 乎 乔 吐 率 。 但 是 , 像 多 媒体 点 播 系统 ,就 希望 系统 的 吞吐 量 很 大 ， 
要 求 单位 时 间 内 能 有 大 量 数据 读 出 ,以 满足 播放 要 求 。 

3. 数据 传输 率 中 的 K、M、G 等 单位 的 含义 和 主 存 容量 中 的 含义 一 样 吗 ? 在 磁盘 容量 
中 的 含义 呢 ? 

答 : 不 一 样 。 在 主 存 容量 中 1K==2*、1M 二 2*”、1G 二 2”。 但 是 ,在 数据 传输 率 中 ,因为 
数据 传输 速度 和 时 钟 频 率 有 关 , 时 钟 频率 通常 以 kHz、MHz、GHz 来 表示 ,所 以 ,传输 速率 一 
般 用 kB/s、.MB/s、GB/s 来 表示 ,这 里 的 1k==10;、1M 二 10; .1G 二 10;。 计 算 中 可 能 会 混合 在 
一 起 ,因为 ,数据 块 的 大 小 还 是 用 1K=2*、1M 二 2*、1G 二 2” ,而 传输 速率 又 和 数据 块 大 小 
有 关 , 这 样 使 得 计算 变 得 很 复杂 。 

磁盘 容量 以 兆 字 节 (CMB) 或 千 兆 字 节 (GB) 等 为 单位 ,1GB 王 1024MB 王 28%B。 但 硬盘 厂 
商 在 标 称 硬盘 容量 时 通常 取 1G 二 1000M 二 10? ,因此 在 BIOS 或 在 硬盘 格式 化 时 标 出 的 容量 
会 比 厂家 标 称 值 小 。 

4, 什么 是 I/O 设备 的 数据 速率 ? 各 种 外 设 的 数据 速率 相差 很 大 吗 ? 

答 : I/O 设备 的 数据 速率 是 指 在 I/O 设备 和 主机 之 间 传 输 数 据 时 的 峰值 速率 。 各 种 
I/O 设备 的 数据 速率 相差 很 大 。 有 键盘 、 鼠 标 这 种 极 慢 速 的 设备 ,大 约 每 秒 钟 10 个 字 节 ,也 
有 磁盘 和 网 络 设备 等 这 些 每 秒 能 达到 几 十 兆 字 节 的 快速 设备 。 不 同 传输 速率 的 外 设 所 用 的 
外 设 接口 不 同 ,在 主板 上 的 连接 方式 不 同 ,所 用 的 1/0 方式 也 不 同 。 

5. 磁盘 上 信息 是 如 何 组 织 的 ? 磁盘 的 最 小 编 址 单位 是 什么 ? 

答 : 磁盘 表面 被 分 为 许多 同心 圆 ,每 个 同心 圆 被 称 为 一 个 磁道 。 信 息 存 储 在 磁道 上 。 
每 个 磁道 被 划分 为 若干 段 , 称 为 扁 区 。 每 个 扇 区 存放 一 个 记录 块 , 每 个 记录 块 有 相应 的 地 址 
标识 字段 数据 字段 和 校 验 字段 等 。 到 磁盘 上 寻找 数据 时 ,只 要 定位 数据 所 在 的 磁头 、 磁 道 
和 扇 区 。 所 以 , 扇 区 是 磁盘 的 最 小 编 址 单位 。 

6. 一 个 磁盘 扇 区 的 大 小 总 是 512 字 节 吗 ? 

答 : 不 是 。 近 三 十 年 来 ,一 个 硬盘 扇 区 的 大 小 一 直 都 是 512 字 节 。 但 是 ,最 近 几 年 , 硬 
盘 制 造 商 正在 从 传统 的 512 字 节 扇 区 迁移 到 更 大 更 高 效 的 4096 字 节 扇 区 ,通常 称 为 4K 
扇 区 。 

7. 盘面 号 和 磁头 号 是 一 回 事 吗 ? 

答 : 是 的 。 硬 盘 是 一 个 盘 组 ,由 多 个 盘 片 组 成 ,每 个 盘 片 有 两 个 面 。 每 个 盘面 上 有 一 个 
磁头 ,用 于 对 该 盘面 上 的 信息 进行 读 写 。 所 以 ,磁头 号 就 是 盘面 号 。 

8. 柱 面 号 和 磁道 号 是 一 回 事 吗 ? 

答 : 是 的 。 硬 盘 是 一 个 盘 组 ,由 多 个 盘面 组 成 ,所 有 盘面 上 相同 编号 的 磁道 构成 了 一 个 
圆柱 面 ( 但 物理 上 这 个 圆柱 面 是 不 存在 的 ), 有 多 少 磁 道 就 形成 多 少 圆柱 面 。 所 以 ,磁道 号 就 
是 圆柱 面 号 。 

9。 当 一 个 磁道 存 满 后 ,信息 是 在 同一 个 盘面 的 下 一 个 磁道 存放 ,还 是 在 同一 个 柱 面 的 
下 一 个 盘面 存放 ? 

答 : 当 一 个 磁道 存 满 后 ,如 果 信 息 是 在 同一 个 盘面 的 下 一 个 磁道 存放 , 则 需要 移动 磁 
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头 , 因 为 移动 磁头 是 机 械 运动 ,所 以 花费 时 间 较 长 ,上 且 有 机 械 磨损 ;如 果 信 息 在 同一 个 柱 面 的 
下 一 个 盘面 存放 , 则 不 需 移 动 磁 头 , 即 磁道 号 不 变 , 只 要 给 出 一 个 相 邻 盘面 号 ,通过 译 码 电 路 
选取 该 盘面 的 磁头 就 可 以 读 写 , 几 乎 没有 延迟 ,也 没有 机 械 运动 。 

10. 1/O 接口 就 是 1/O 端口 吗 ? 

答 : 不 是 。I/O 接口 和 I/O 端口 是 两 个 不 同 的 概念 ,但 相互 之 间 有 关联 。I/O 接口 是 
主机 和 外 设 之 间 传 送信 息 的 “桥梁 ”, 介 于 主机 和 外 设 之 间 。 主 机 控制 外 设 的 命令 信息 、 传 送 
给 外 设 的 数据 或 从 外 设 取 来 的 数据 、 外 设 送 给 主机 的 状态 信息 等 都 要 先 存 放 到 I/O 接口 
中 ,所 以 ,接口 中 有 一 些 寄存 器 ,用 于 存放 这 些 命令 、 数 据 和 状态 信息 。 把 W/O 接口 中 的 这 
些 寄 存 器 称 为 1/O 端口 。 

11, 1/O 端口 是 如 何 编 址 的 ? 

答 : 一 般 有 两 种 编 址 方式 : 独立 编 址 和 统一 编 址 。 这 里 的 “统一 ”和 “独立 ”不 是 指 各 个 
不 同 接口 之 间 的 “统一 ”和 “独立 ”关系 ,而 是 指 所 有 1/O 端口 号 组 成 的 地 址 空间 (IO 地 址 空 
间 ) 和 所 有 主 存单 元 号 组 成 的 地 址 空间 ( 主 存 地 址 空间 ) 之 间 的 关系 。 

12， CPU 是 如 何 访问 MO 端口 的 ? 

答 : 在 I/O 指令 中 给 出 要 访问 的 端口 号 , 当 CPU 执行 I/O 指令 时 ,根据 指令 的 操作 码 
或 地 址 范围 得 知 要 访问 1/O 地 址 空间 ,因而 在 总 线 的 地 址 线 上 送出 端口 号 ,在 总 线 的 控制 
线 上 送出 I/O 读 或 IO 写 命令 ,被 访问 端口 所 在 的 接口 电路 对 地 址 译 码 后 选中 相应 的 端 
口 ,并 从 控制 线 上 取得 读 / 写 命令 ,由 接口 中 的 读 / 写 控 制 电 路 对 被 访问 端口 进行 读 或 写 
操作 。 

13. 一 个 I/O 接口 只 能 有 一 个 地 址 吗 ? 

答 : 不 是 。 每 个 IO 端口 对 应 唯一 的 一 个 地 址 ,但 一 个 IO 接口 中 可 能 有 多 个 程序 可 
访问 的 寄存 器 ,也 就 是 有 多 个 I/O 端口 ,所 以 应 该 有 多 个 地 址 。 

14. 程序 查询 方式 下 ,外 设 的 数据 是 直接 和 CPU 交换 的 吗 ? 

答 : 是 的 。 程 序 查询 方式 下 ,整个 输入 输出 过 程 是 通过 CPU 执行 查询 程序 完成 的 ,所 
有 信息 (命令 数据 ,状态 ) 的 交换 具体 由 查询 程序 中 的 W/O 指令 进行 控制 ,因而 外 设 的 数据 
是 直接 和 CPU 交换 的 。 

外 设 的 数据 和 状态 信息 通过 I/O 接口 中 设备 侧 的 电缆 线 ( 通 信和 总 线 ) 送 到 I/O 接口 中 ， 
连同 接口 本 身 的 状态 信息 一 起 记录 到 相应 的 数据 或 状态 端口 中 ,CPU 再 通过 执行 输入 指令 
(如 80x86 中 的 IN 指令 ) 从 IO 端口 中 将 状态 或 数据 取 到 CPU 的 寄存 器 中 。CPU 送 到 外 
设 的 数据 和 命令 字 ,通过 执行 输出 指令 (如 80x86 中 的 OUT 指令 ) 从 CPU 中 的 寄存 器 送 到 
相应 的 IO 端口 中 。 

15. 中 断 方 式 下 ,外 设 的 数据 是 直接 和 CPU 交换 的 吗 ? 

答 : 是 的 。 中 断 方式 下 , 当 外 设 完成 任务 (如 打印 完 一 个 字符 、 键 盘 有 按键 等 ) ,或 外 设 
发 生 了 特殊 事件 (如 打印 机 缺 纸 .过 程控 制 中 温度 太 高 、. 采 样 定时 到 等 ), 外 设 通 过 向 CPU 
发 中 断 请 求 来 中 止 CPU 正在 执行 的 程序 , 转 到 相应 的 中 断 服务 程序 去 执行 ,处 理 完 后 , 回 
到 原 被 中 止 的 程序 继续 执行 。 通 常 在 CPU 执行 中 断 服务 程序 过 程 中 完成 数据 的 交换 ,如 
从 键盘 缓冲 取 数 据 ,向 打印 机 缓冲 发 送 打 印字 符 , 取 采样 数据 等 。 这 些 都 是 通过 CPU 执行 
LO 指令 来 完成 的 ,因而 ,对 于 采用 中 断 方式 的 IO 过 程 ,外 设 的 数据 是 直接 和 CPU 交 
换 的 。 
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16. DMA 方式 下 ,外 设 的 数据 是 直接 和 CPU 交换 的 吗 ? 

答 : 不 是 。DMA 方式 适合 像 磁盘 一 类 的 高 速 设备 ,以 成 批 方式 交换 几 百 到 几 千 字 节 数 
据 ,CPU 不 可 能 放 得 下 那么 多 数据 。 所 以 ,DMA 方式 下 ,设备 直接 和 主 存 进行 数据 交换 ,由 
专门 的 硬件 (DMA 控制 器 ) 控 制 在 主 存 和 外 设 之 间 进 行 数据 传送 。 

17， 中 断 方式 下 ,外 设 任何 时 候 都 可 以 申请 中 断 并 马上 得 到 响应 玛 ? 

答 : 不 是 。 中 断 方式 下 ,外 设 何 时 发 出 中 断 请 求 是 由 外 设 接口 中 的 中 断 逻 辑 决 定 的 ,不 
受 CPU 的 限制 ,但 何 时 响应 中 断 与 CPU 执行 指令 过 程 有 关 。CPU 总 是 在 一 条 指令 执行 
完 、 取 下 条 指令 之 前 去 查询 有 无 中 断 请 求 。 如 果 此 时 是 开 中 断 状 态 ,并 有 未 被 屏 项 的 中 断 请 
求 发 生 , 则 CPU 自动 执行 一 条 隐 指 令 , 进 行 中 断 响应 ,完成 关中 断 、 保 护 断 点 ` 取 中 断 向 量 3 
个 操作 。 因 此 ,不 是 任何 时 候 都 马上 响应 中 断 ,中断 响应 的 条 件 有 3 个 : (1)CPU 处 于 开 中 
断 状态 (中 断 允 许 触发 器 EINT 置 “1? 状 态 ); 〈2? 至 少 有 一 个 未 被 屏蔽 的 中 断 请 求 发 生 ， 
(3) 一 条 指令 执行 结束 。 

18. 为 什么 在 介绍 CPU 设计 时 要 讲 中 断 的 概念 ,在 介绍 I/O 系统 时 又 讲 中 断 的 概念 ? 

答 : 在 CPU 执行 程序 过 程 中 ,有 两 种 情况 会 打 断 程序 的 执行 ,一 种 情况 是 CPU 正在 执 
行 的 指令 出 现 了 “异常 ”或 设置 了 “陷阱 ”; 男 一 种 情况 是 指令 执行 正常 ,但 外 部 设备 出 现 了 特 
殊 事件 ,要 求 CPU 处 理 。 一 般 把 前 者 称 为 “异常 ”, 后 者 称 为 “中 断 ”( 也 有 很 多 系统 或 教科 
书 不 分 “异常 "和 “中 断 ”, 全 部 称 为 “中 断 ”)。 

在 进行 CPU 设计 时 ,必须 考虑 在 数据 通路 中 如 何 实现 异常 和 中 断 处 理 , 包 括 : 如 何 设 
置 “ 开 /关中 断 ” 状 态 ,如 何 判 断 是 否 发 生 了 异常 和 中 断 、 如 何 识别 是 哪 类 异常 和 中 断 、 怎 样 保 
存 断 点 、 如 何 切 换 到 中 断 服务 程序 等 。 因 此 ,在 第 6 章 介绍 CPU 设计 时 出 现 了 异常 和 中 断 
的 概念 。 

同时 ,“ 中 断 ” 作 为 一 种 I/O 方式 ,在 许多 采用 中 断 方式 的 外 设 接口 电路 中 ,必须 要 有 相 
应 的 中 断 处 理 逻 辑 , 因 此 ,在 本 章 涉及 I/O 系统 设计 时 ,也 谈 到 了 很 多 有 关中 断 的 概念 。 

19. 为 什么 在 响应 中 断 的 时 候 保存 断 点 ,而 在 处 理 中 断 的 时 候 保存 现场 ? 

答 : 断 点 是 中 断 返 回 到 被 中 断 程 序 继续 执行 处 指令 的 地 址 ( 即 : 响应 中 断 时 PC 的 值 )， 
必须 在 中 断 响 应 时 先 保存 到 栈 中 ,否则 , 当 取 来 中 断 服 务 程序 的 首 地 址 送 PC 后 ,原来 作为 
断 点 的 PC 的 值 就 被 破坏 了 。 面 现场 是 被 中 断 的 原 程 序 在 断 点 处 各 个 寄存 器 的 值 ,只 要 在 
这 些 寄存 器 再 被 使 用 前 保存 到 栈 中 就 行 了 ,因为 在 实际 处 理 中 断 事 件 过 程 中 可 能 要 用 到 这 
些 寄存 器 ,所 以 在 具体 中 断 处 理 之 前 的 准备 阶段 来 保存 现场 (寄存 器 压 栈 ), 面 在 具体 处 理 后 
的 结束 阶段 再 恢复 现场 (寄存 器 出 栈 ) 。 这 样 就 能 保证 被 中 断 程序 的 现场 不 被 中 断 服务 程序 
破坏 。 

20. 单 重 中 断 和 多 重 中 断 的 区 别 是 什么 ? 

答 : 单 重 中 断 情况 下 ,在 中 断 处 理 整个 过 程 中 ,不 允许 响应 新 的 中 断 请 求 ,其 做 法 是 在 
中 断 响应 开始 时 关中 断 ( 使 中 断 允 许 触发 器 置 “0”), 而 直到 中 断 处 理 结束 后 才 开 中 断 , 然 后 
返回 到 原 断 点 处 继续 执行 。 

多 重 中 断 系统 中 ,如 果 在 进行 某 个 具体 的 中 断 处 理 过 程 中 ,又 发 生 了 新 的 中 断 请 求 , 则 
可 以 中 止 正在 进行 的 中 断 处 理 , 转 到 新 的 中 断 服务 程序 执行 。 因 此 ,在 中 断 处 理 过 程 中 ,应 
该 开 中 断 ,允许 响应 新 的 中 断 请 求 。 其 做 法 是 在 实际 处 理 中 断 事件 前 就 开 中 断 ,而 不 是 像 单 
重 中 断 那样 在 处 理 后 才 开 中 断 。 这 样 保证 在 实际 中 断 处 理 过 程 中 可 以 响应 新 的 中 断 请 求 。 
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21. 向 量 中 断 、 中 断 向 量 、 向 量 地 址 3 个 概念 是 什么 关系 ? 

答 : 中 断 向 量 : 每 个 中 断 源 都 有 对 应 的 处 理 程序 , 称 这 个 处 理 程序 为 中 断 服 务 程序 ,其 
入 口 地 址 称 为 中 断 向 量 。 所 有 中 断 的 中 断 服务 程序 人 口 地 址 构成 一 个 表 , 称 为 中 断 向 量 表 ; 
有 的 机 器 也 把 中 断 服务 程序 人 口 的 跳 转 指 令 构 成 一 张 表 , 称 为 中 断 向 量 跳 转 表 。 

向 量 地 址 : 中 断 向 量 表 或 中 断 向 量 跳 转 表 中 每 个 表 项 所 在 的 主 存 地 址 或 表 项 的 索引 
值 , 称 为 向 量 地 址 或 中 断 类 型 号 。 

向 量 中 断 : 是 指 一 种 识别 中 断 源 的 技术 或 方式 。 识 别 中 断 源 的 目的 就 是 要 找到 中 断 源 
对 应 的 中 断 服务 程序 的 人 口 地 址 , 即 获得 向 量 地 址 。 采 用 向 量 中 断 进行 中 断 源 识别 的 做 法 
如 下 : 通过 某 种 硬件 排队 线路 (如 : 菊花 链 、 并 行 判 优等 ), 对 所 有 未 被 屏蔽 的 中 断 请 求 进 行 
排队 , 选 出 优先 级 最 高 的 中 断 源 ,然后 对 其 编码 ,得 到 该 中 断 源 的 编号 (可 以 转换 为 向 量 地 
址 ,有 些 书 中 就 称 其 为 向 量 地 址 )。 通 过 总 线 将 其 取 到 CPU 中 ,并 转换 成 向 量 地 址 ,从 而 取 
出 中 断 服务 程序 入 口 地 址 ,或 跳 转 到 中 断 服 务 程序 。 还 有 一 种 是 用 程序 (中 断 查 询 程 序 ) 进 
行 中 断 源 识 别 的 软件 方法 。 

22. 禁止 中 断 和 屏蔽 中 断 是 同一 个 概念 四 ? 

答 : 它们 是 两 个 完全 不 相关 的 概念 。 

禁止 中 断 就 是 关中 断 , 即 将 中 断 允 许 触发 器 置 为 “0”, 此 时 ,任何 中 断 请 求 都 得 不 到 响 
应 。 屏 项 中 断 是 多 重 中 断 系 统 中 的 一 个 概念 ,是 指 某 个 中 断 正 在 被 处 理 时 ,如 果 有 其 他 新 的 
中 断 请 求 发 生 ,那么 ,通过 设置 中 断 屏 项 位 ,可 确定 是 否 允 许 响应 新 发 生 的 中 断 请 求 。 它 反 
映 了 正在 处 理 的 中 断 与 其 他 各 中 断 之 间 的 处 理 优先 级 顺序 ,所 以 每 个 中 断 都 有 一 个 中 断 屏 
项 字 , 其 中 的 每 一 位 对 应 一 个 中 断 的 屏蔽 位 。 响 应 某 个 中 断后 ,就 会 把 该 中 断 的 中 断 屏 项 字 
送 到 中 断 屏蔽 字 寄 存 器 中 ,在 中 断 排 队 前 ,其 中 的 每 一 位 和 中 断 请 求 寄存 器 中 的 对 应 位 进行 
“与 ?操作 ,因而 ,只 有 未 被 屏蔽 的 中 断 源 进入 排队 线路 ,从 而 有 可 能 得 到 响应 。 

23. 中 断 响 应 优先 级 和 中 断 处 理 优先 级 一 样 吗 ? 

答 : 不 一 样 ,这 是 两 个 不 同 的 概念 。 中 断 响应 优先 级 是 由 硬件 排队 线路 或 中 断 查询 程 
序 的 查询 顺序 决定 的 ,不 可 动态 改变 ;而 中 断 处 理 优先 级 可 以 由 中 断 屏 项 字 来 改变 ,反映 的 
是 正在 处 理 的 中 断 是 否 比 新 发 生 的 中 断 的 处 理 优先 级 低 , 如 果 是 ,就 中 止 正 在 处 理 的 中 断 ， 
转 到 新 中 断 去 处 理 , 处 理 完 后 回 到 原 被 中 止 的 中 断 继续 处 理 。 

24. DMA 方式 下 ,在 主 存 和 外 设 之 间 有 一 条 物理 通路 直接 相连 吗 ? 

答 : 没有 。 通 常 所 说 的 DMA 方式 下 数据 在 主 存 和 外 设 之 间 直 接 进行 传送 ,其 含义 并 
不 是 说 在 主 存 和 外 设 之 间 建 立 一 条 物理 上 的 直接 通路 ,而 是 在 主 存 和 外 设 之 间 通 过 外 设 接 
口 、 系 统 总 线 以 及 总 线 桥接 部 件 等 连接 ,建立 起 一 个 信息 可 以 互相 通达 的 通路 。“ 直 接 通 路 ” 
是 逻辑 上 的 含义 ,物理 上 磁盘 和 主 存 不 是 直接 相连 的 。 

25. DMA 方式 下 ,CPU 一 点 开销 都 没有 吗 ? 

答 : 不 是 。DMA 方式 下 的 数据 交换 过 程 分 以 下 3 个 步骤 : 

(1) DMA 控制 器 的 初始 化 。 将 所 要 传送 的 数据 个 数 、 内 存 地 址 、 传 送 方向 等 送 到 DMA 
控制 器 。 这 个 过 程 由 CPU 执行 指令 来 完成 。 初 始 化 结束 后 , CPU 发 送 启动 磁盘 定位 和 
DMA 传送 的 命令 ,这 也 是 通过 CPU 执行 输出 指令 来 完成 的 。 

《2) DMA 传送 。 这 个 过 程 整个 都 是 由 DMA 控制 器 来 完成 的 ,主要 由 DMA 控制 器 控 
制 系统 总 线 , 完 成 数据 在 主 存 和 外 设 之 间 的 数据 传送 。 
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(3) DMA 传送 结束 处 理 。DMA 传送 结束 后 ,向 CPU 发 出 “DMA 结束 ”中 断 请 求 , 由 
CPU 执行 相应 的 中 断 服务 程序 进行 数据 校 验 等 后 处 理工 作 。 

综 上 所 述 ,DMA 方式 下 ,CPU 要 进行 初始 化 和 后 处 理 两 部 分 工作 ,因此 ,不 是 一 点 开销 
都 没有 ,只 是 相对 于 程序 查询 方式 和 中 断 方式 来 说 ,CPU 介入 要 少 得 多 ,因为 CPU 不 需要 
介入 主要 的 数据 传送 过 程 。 

26， CPU 对 DMA 请 求 和 中 断 请 求 的 响应 时 间 是 否 一 样 ? 

答 : 不 一 样 。DMA 方式 下 ,向 CPU 请 求 的 是 总 线 控制 权 , 要 求 CPU 让 出 总 线 控制 权 
给 DMA 控制 器 ,由 DMA 控制 器 来 控制 总 线 完成 主 存 和 外 设 之 间 的 数据 交换 ,因此 ,CPU 
只 要 用 完 总 线 后 就 可 以 响应 请 求 ,释放 总 线 ,让 出 总 线 控制 权 。CPU 总 是 在 一 次 总 线 事 务 
完成 后 响应 ,因此 ,DMA 响应 时 间 应 该 少 于 一 个 总 线 周 期 ;而 中 断 方式 下 请 求 的 是 CPU 时 
间 ,要 求 CPU 中 止 正在 执行 的 程序 , 转 到 中 断 服 务 程序 去 执行 ,通过 执行 中 断 服 务 程 序 , 对 
中 断 事件 进行 相应 的 处 理 。CPU 总 是 要 等 到 一 条 指令 执行 结束 后 , 才 去 查询 有 无 中 断 请 
求 , 所 以 响应 时 间 少 于 一 个 指令 周期 的 时 间 。 

27， 挪用 周期 方式 下 ,DMA 控制 器 窃取 的 是 什么 周期 ? 

答 : 周期 挪用 法 的 基本 思想 是 , 当 外 设 准 备 好 一 个 数据 时 ,DMA 控制 器 就 向 CPU 申请 
一 次 总 线 控制 权 ,CPU 在 一 个 总 线 事务 结束 时 一 旦 发 现 有 DMA 请 求 , 就 立即 释放 总 线 , 让 
出 一 个 周期 给 DMA 控制 器 ,由 DMA 控制 器 控制 总 线 在 主 存 和 外 设 之 间 传 送 一 个 数据 , 传 
送 结束 后 立即 释放 总 线 , 下 次 外 设 准 备 好 数据 时 ,又 重复 上 述 过 程 ,直到 所 有 数据 传送 完毕 。 
这 种 情况 下 ,CPU 的 工作 几乎 不 受 影 响 ,只 是 在 万 一 出 现 访 存 冲突 时 ,CPU 挪 出 一 个 周期 
给 DMA, 由 DMA 访问 主 存 ,而 CPU 延迟 访问 主 存 。 这 里 CPU 挪 出 的 是 主 存 的 存储 周期 。 


9.5 单项 选择 题 


1. 假定 有 一 个 事务 处 理 系 统 A, 其 处 理 器 的 速度 为 每 秒 钟 执行 5 千 万 条 指令 ,每 个 事 
务 需要 5 次 VO 操作 ,每 次 I/O 操作 需要 10000 条 指令 。 如 果 系 统 A 每 秒 钟 最 多 完成 1000 次 
WO 操作 , 则 它 每 秒 钟 处 理 的 事务 数 最 多 能 达到 ( “) 个 。( 忽 略 延 迟 并 假定 事务 可 以 不 受 


限制 地 并 行 处 理 ) 

A. 200 B. 1000 C. 2000 D. 10000 
2. 以 下 各 类 外 设 中 ,属于 成 块 传送 设备 的 是 ( 3 

A. 键盘 B. 鼠标 器 C. 针 式 打印 机 D. U 盘 
3. 以 下 各 类 外 设 中 ,属于 存储 设备 的 是 ( 0 

A. 键盘 B. 鼠标 器 C. 显示 器 D. 磁带 机 
4. 以 下 各 类 外 设 中 ,属于 字符 型 设备 的 是 ( ) 。 

A. Modem B. 硬盘 存储 器 C. 光驱 D. 软驱 


5. 以 下 是 有 关 非 编码 键盘 和 鼠标 器 的 描述 : 
@ 键盘 和 鼠标 都 是 字符 型 输入 设备 
@ 键盘 和 鼠标 都 以 串 行 方式 和 主机 通信 
@ 键盘 和 鼠标 都 采用 中 断 方式 进行 数据 传送 
@ 键盘 和 鼠标 向 主机 传送 的 都 是 位 置信 息 
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以 上 描述 中 ,正确 的 是 (  )。 
A. OO B. DO C. DO@ D. 全 部 
6. 在 采用 中 断 方式 进行 打印 控制 时 ,在 打印 控制 接口 电路 和 打印 部 件 之 间 交 换 的 信息 
不 包括 以 下 的 (  )。 
A. 打印 字符 点 阵 信息 B. 打印 控制 信息 
C. 打印 机 状态 信息 D. 中 断 请 求 信号 
7. 以 下 是 有 关 激 光 打 印 机 中 打印 控制 器 功能 的 叙述 ,其 中 错误 的 是 ( )。 
A. 接收 主机 送 来 的 打印 字符 点 阵 信 息 
B. 缓存 主机 送 来 的 各 种 打印 描述 信息 
C. 对 打印 语言 中 描述 的 各 种 命令 进行 解释 
D. 对 打印 内 容 按 页 面 设 置 参 数 进 行 光栅 化 
8. 假定 一 台 计 算 机 的 显示 存储 器 用 DRAM 芯片 实现 , 若 要 求 显 示 分 辩 率 为 1600 X 
1200 ,颜色 深度 为 24 位 , 帧 频 为 85Hz, 显 存 总 带宽 的 50% 用 来 刷新 屏幕 , 则 需要 的 显存 总 
带宽 至 少 约 为 ( ) 。 
A. 245Mbps B. 979Mbps C. 1958Mbps D. 7834Mbps 
9. 随 着 3D 游戏 软件 的 大 量 出 现 , 许 多 机 器 的 显卡 中 配置 了 具有 3D 功能 的 GPU, 以 下 
有 关 这 类 显卡 的 显示 存储 器 (VRAM ,显存 ) 的 叙述 中 ,错误 的 是 ( » 
A. 显存 大 多 由 DRAM 芯片 组 成 
B. CPU 和 GPU 都 可 以 访问 显存 
C, 显存 和 主 存 之 间 可 采用 DMA 方式 传送 数据 
D. 显存 容量 大 致 等 于 最 高 分 辩 率 与 像素 深度 的 乘积 
10. 以 下 有 关 磁 盘 驱 动 器 的 叙述 中 ,错误 的 是 ( ) 。 
A.， 送 到 磁盘 驱动 器 的 盘 地 址 由 磁头 号 、 盘 面 号 和 扁 区 号 组 成 
B. 能 控制 磁头 移动 到 指定 磁道 ,并 发 回 “ 寻 道 结束 ”信号 
C. 能 控制 磁盘 片 转 过 指定 的 扇 区 ,并 发 回 “ 扇 区 符合 ”信和 号 
D. 能 对 指定 盘面 的 指定 扇 区 进行 数据 的 读 或 写 操作 
11. 假定 一 个 磁盘 存储 器 有 4 个 盘 片 ,用 于 记录 信息 的 柱 面 数 为 2000, 每 个 磁道 上 有 
3000 个 扇 区 ,每 个 扇 区 512B, 则 该 磁盘 存储 器 的 容量 约 为 ( ” )。 
A. 12MB B. 24MB C. 12GB D. 24GB 
12. 假定 一 个 磁盘 的 转速 为 7200RPM ,磁盘 的 平均 寻 道 时 间 为 20ms, 平 均 数 据 传输 率 
为 1MB/s, 不 考虑 排队 等 待 时 间 。 那 么 读 一 个 512 字 节 的 扇 区 的 平均 时 间 大 约 为 (  )。 
A. 14. 7ms B. 18. 8ms C. 24. 7ms D. 28. 8ms 
13. 假定 计算 机 系统 中 连接 主 存 和 磁盘 的 总 线 带宽 是 68. 8MB/s, 磁盘 的 最 大 数据 传输 
率 是 5MB/s。 如 果 人 允许 磁盘 输入 /输出 占用 100% 的 总 线 和 主 存 带 宽 ,那么 总 线 上 可 同时 接 
人 的 磁盘 个 数 最 多 是 ( es 
A. 13 B. 14 ls D. 16 
14. 以 下 有 关 RAID 技术 的 叙述 中 ,错误 的 是 (。” )。 
A. RAID 技术 可 实现 海量 后 备 存 储 系统 
B. RAID 技术 可 提高 存储 系统 的 可 靠 性 


人 人 


C. RAID 中 的 校 验 信息 都 存放 在 一 个 磁盘 上 
D. RAID 通过 多 个 盘 并 行 访问 来 提高 速度 
15. 以 下 关于 光盘 存储 器 的 叙述 中 ,错误 的 是 (  )。 
A. 光盘 的 数据 记录 在 一 条 连续 的 螺旋 状 光 道上 
B. 光盘 读 / 写 信息 时 可 采用 恒定 线 速度 方式 进行 旋转 
C. 光盘 上 四 坑内 的 信息 为 0, 四 坑 外 的 信息 为 1 
D. 光盘 上 存储 信息 的 地 址 用 时 间 单 位 来 表示 
16. 主机 和 外 设 之 间 的 正确 连接 通路 是 (  )。 
A. CPU 和 主 存 一 1/O 总 线 一 I/O 接口 (外 设 控制 器 ) 一 通信 和 总 线 ( 电 缆 ) 一 外 设 
B. CPU 和 主 存 一 1/O 接口 (外 设 控制 器 ) 一 IO 总 线 一 通信 和 总线 (电缆 ) 一 外 设 
C. CPU 和 主 存 一 I/O 总 线 一 通信 总 线 (电缆 ) 一 1/O 接口 (外 设 控制 器 ) 一 外 设 
D. CPU 和 主 存 一 1/O 接口 (外 设 控制 器 ) 一 通信 总 线 ( 电 缆 ) 一 1/O 总 线 一 外 设 
17. 以 下 有 关 I/O 接口 功能 和 结构 的 叙述 中 ,错误 的 是 ( )。 
A. IO 接口 就 是 像 显 卡 或 网 卡 之 类 的 一 种 外 设 控制 逻辑 
B. CPU 可 以 向 I/O 接口 传送 用 来 对 设备 进行 控制 的 命令 
C. CPU 可 以 从 1/O 接口 取 状 态 信息 ,以 了 解 接口 和 外 设 的 状态 
D. 1/O 接口 中 主机 侧 数据 宽度 与 设备 侧 数据 宽度 总 是 一 样 
18. 以 下 有 关 I/O 端口 的 叙述 中 ,错误 的 是 ( ”)。 
A. I/O 接口 中 程序 可 访问 的 寄存 器 被 称 为 I/O 端口 
B. I/O 接口 中 有 命令 端口 ,状态 端口 和 数据 端口 
C. I/O 端口 可 以 和 主 存 统一 编号 ,也 可 以 单独 编号 
D. I/O 接口 中 命令 端口 和 状态 端口 不 能 共用 同一 个 
19. 以 下 给 出 的 部 件 中 ,不 包含 在 外 设 控 制 接口 电路 中 的 是 ( )。 
A, 标志 寄存 器 B. 数据 缓存 器 
C. 命令 (控制 ) 寄 存 器 D. 状态 寄存 器 
20. 以 下 有 关 统 一 编 址 方式 的 描述 中 ,错误 的 是 (  )。 
A. I/O 端口 地 址 和 主 存 地 址 一 定 不 重 号 
B.CPU 通过 执行 访 存 指令 来 访问 I/O 端口 
C. 必须 根据 指令 类 型 区 分 访问 主 存 还 是 访问 I/O 端口 
D. 可 利用 主 存 的 存储 保护 措施 对 I/O 端口 进行 存储 保护 
21. 点 对 点 W/O 接口 只 能 连接 一 个 外 设 ,而 总 线 式 多 点 W/O 接口 可 连接 多 个 外 设 。 以 
下 给 出 的 几 类 1/O 接口 中 ,不 是 总 线 式 多 点 IO 接口 的 是 ( )。 
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A. USB B. RS-232 C. SCSI D. IEEE 1394( 火 线 ) 
22. 以 下 给 出 的 几 类 IO 接口 中 ,可 以 采用 并 行 传输 方式 的 是 (  )。 
A. USB B. RS-232 C. SCSI D. IEEE 1394( 火 线 ) 


23. 某 终 端 通过 串 行 通 信 接 口 与 主机 相连 ,采用 起 止 式 异 步 通信 方式 , 若 传 输 速率 为 
9600 波 特 ,采用 两 相 调制 技术 。 通 信 协 议 为 7 位 数据 、1 位 校 验 位 、1 位 停止 位 。 传 送 一 个 
字符 所 需 时 间 约 为 ( )。 

A. 0. 94ms B. 1. 88ms C. 1. 04ms D. 2. 08ms 
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24. 


25. 


以 下 IO 控制 方式 中 ,主要 由 硬件 而 不 是 软件 实现 数据 传送 的 方式 是 (  )。 
A. 程序 查询 方式 B. 程序 中 断 方式 

C. DMA 方式 D. 无 条 件 程序 控制 方式 

以 下 是 有 关 程 序 直 接 控制 (查询 )I/O 方式 的 叙述 : 

@ 无 条 件 传送 接口 中 不 记录 状态 ,无 须 状态 查询 ,可 直接 定时 访问 

@ 条 件 传送 接口 中 有 “就 绪 ”“ 完 成 ”等 状态 ,可 定时 查询 或 独占 查询 

@ 通过 CPU 执行 相应 的 无 条 件 传送 程序 或 查询 程序 来 完成 数据 传送 

@ 适合 巡回 检测 采样 系统 或 过 程控 制 系统 ,以 及 非 随 机 启动 的 字符 型 设备 
以 上 叙述 中 ,正确 的 有 (  )。 


A. DO B. DO C. DB.@ D. 全 部 
26. 下 列 选 项 中 ,能 引起 外 部 中 断 请 求 的 事件 是 ( ”)。 
A， 鼠 标 输入 B. 除数 为 0 
C. 浮 点 运算 下 洲 D. 访 存 缺 页 
27. 下 列 选 项 中 ,不 属于 外 部 中 断 的 事件 是 ( )。 
A. 采样 定时 到 B. 无 效 操作 码 
C. 打印 机 缺 纸 D. 键盘 缓冲 满 
28. 下 列 选 项 中 ,能 引起 外 部 中 断 请 求 的 事件 是 (  )。 
A. 一 条 指令 执行 结束 B. 一 次 总 线 传输 结束 
C. 一 次 中 断 处 理 结束 D. 一 次 DMA 操作 结束 
29. 以 下 ( 情况 出 现时 ,会 引起 CPU 自动 查询 有 无 中 断 请 求 , 进 而 可 能 进入 中 断 
响应 周期 。 
A. 一 条 指令 执行 结束 B. 一 次 IO 操作 结束 
C. 一 次 中 断 处 理 结束 D. 一 次 DMA 操作 结束 


30, 


31. 


32. 


33. 


以 下 有 关 CPU 响应 外 部 中 断 请 求 的 叙述 中 ,错误 的 是 ( 

A. 每 条 指令 结束 后 ,CPU 都 会 转 到 “中 断 响应 ?周期 进行 中 断 响应 处 理 

B. 在 “中 断 响应 ”周期 ,CPU 先 将 中 断 允 许 触发 器 清 "0” ,以 使 CPU 关中 断 
C. 在 “中 断 响应 ?周期 ,CPU 把 后 继 指令 地 址 作为 返回 地 址 保存 在 固定 地 方 
D. 在 “中 断 响 应 ?周期 ,CPU 把 取得 的 中 断 服务 程序 的 入口 地 址 送 PC 

单 级 中 断 系 统 中 ,中 断 服务 程序 内 的 执行 顺序 是 (  )。 


I. 保护 现场 开 . 开 中 断 亚 . 关中 断 KK. 保存 断 点 
V. 中 断 事件 处 理 。 TY. 恢复 现场 开 . 中 断 返回 

A. I>V>VY>I™> B. HH>I>V—>U 

Cc. HI>N>V>VY>W D. N>I>V>V\>Y 

中 断 向 量 地 址 是 指 C(  )。 

A. 子 程序 人 口 地址 B. 中 断 服务 程序 入 口 地 址 


C. 中 断 服务 程序 人 口 地 址 的 地 址 D. 中 断 查询 程序 的 人 口 地 址 
以 下 操作 中 ,由 硬件 完成 的 是 ( )。 

A. 保护 断 点 B. 保护 现场 

C. 设置 中 断 屏蔽 字 D. 从 IO 接口 取 数 


人 


34. 设置 中 断 屏蔽 字 可 以 动态 地 改变 ( 优先 级 。 


A. 中 断 查 询 B. 中 断 响应 C. 中 断 处 理 D. 中 断 返 回 
35. 开 中 断 和 关中 断 两 种 操作 都 用 于 对 ( ”) 进 行 设置 。 

A. 中 断 允 许 触发 器 B. 中 断 屏蔽 寄存 器 

C. 中 断 请 求 寄 存 器 D. 中 断 向 量 寄存 器 


36. 以 下 有 关中 断 IO 方式 的 叙述 中 ,错误 的 是 ( ”)。 
A. 中 断 请 求 的 是 CPU 时 间 ,要 求 CPU 执行 程序 来 处 理发 生 的 相关 事件 
B， CPU 对 外 部 中 断 的 响应 不 可 能 发 生 在 一 条 指令 的 执行 过 程 中 
C. 中 断 IO 方 式 下 ,外 设 接口 中 的 数据 和 CPU 中 某 寄存 器 的 内 容 直 接 交换 
D. 只 要 有 中 断 请 求 发 生 , 那 么 一 条 指令 执行 结束 后 CPU 就 进入 中 断 响应 周期 
37. 假设 计算 机 系统 中 软盘 以 中 断 方式 与 CPU 进行 数据 交换 , 主 频 为 50MHz, 传输 单 
位 为 16 位 ,软盘 的 数据 传输 率 为 50kB/s。 若 每 次 数据 传输 的 开销 (包括 中 断 响应 和 中 断 处 
理 ) 为 100 个 时 钟 周期 , 则 软盘 工作 时 CPU 用 于 软盘 数据 传输 的 时 间 占 整个 CPU 时 间 的 百 


分 比 是 ( 
A. 0% B. 5% C. 1.5% D. 15% 
38. 周期 挪用 方式 常用 于 ( ”“”) 方 式 的 输入 /输出 控制 中 。 
A. DMA B. 中 断 C. 程序 查询 D. 通道 
39. 采用 “周期 挪用 "方式 进行 数据 传送 时 ,每 传送 一 个 数据 要 占用 一 个 (  ”) 的 时 间 。 
A. 指令 周期 B. 机 器 周期 C. 时 钟 周期 D. 存储 周期 


40. DMA 方式 的 数据 交换 不 是 由 CPU 执行 一 段 程序 来 完成 ,而 是 在 (  ) 之 间 建 立 
一 条 逻辑 上 的 直接 数据 通路 ,由 DMA 控制 器 来 实现 的 。 


A. CPU 与 主 存 之 间 B. 外 设 与 主 存 之 间 
C. 外 设 与 CPU 之 间 D. 外 设 与 外 设 之 间 

41. 启动 一 次 DMA 传送 ,外 设 和 主机 之 间 将 完成 一 个 ( “) 的 数据 传送 。 
A. 字 节 B. 字 C. 总 线 宽度 D. 数据 块 


42. 以 下 是 有 关 对 DMA 方式 的 叙述 ， 
@ DMA 控制 器 向 CPU 请 求 的 是 总 线 使 用 权 
@ DMA 方式 可 用 于 键盘 和 鼠标 器 的 数据 输入 
@ DMA 方式 下 整个 I/O 过 程 完全 不 需要 CPU 介入 
@ DMA 方式 需要 用 中 断 处 理 进行 辅助 操作 
以 上 氢 述 中 ,错误 的 是 ( ” ”)。 
A. DO B. @.@ C. @.@ D. @.@ 
43， 以 下 关于 DMA 控制 器 和 CPU 关系 的 叙述 中 ,错误 的 是 ( ”)。 
A. DMA 控制 器 和 CPU 都 可 以 作为 总 线 的 主 控 设 备 
B. DMA 控制 器 和 CPU 都 要 使 用 总 线 时 ,CPU 优先 级 更 高 
C. CPU 可 通过 执行 I/O 指令 来 访问 DMA 控制 器 中 的 寄存 器 
D. CPU 可 通过 执行 IO 指令 来 启动 进行 DMA 传送 的 设备 
【参考 答案 】 
1. A 2. D 3. D 下 -六 5. D 6. D 7. A 
8. D 9. D 10. A 11. D 1 13. A 14.C 
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| 15. C 16. A 17. D 18. D 19. A 20. C 21. B 
| 22. C 23. C 24. C 25. D 26. A 27. B 28. D 
29. A 30. A 31. A 32.C 33. A 34. C 35. A 
36. D 37. B 38. A 39. D 40. B 41. D 42. B 
43. 也 
9.6 分 析 应 用 题 


1， 对 于 磁盘 来 说 , 扇 区 的 编号 方式 直接 影响 磁盘 数据 的 读 写 时 间 。 图 9. 1 所 示 的 两 种 
扇 区 编号 方式 中 , 哪 一 种 编号 方式 可 能 具有 更 好 的 性 能 ? 


MEN AN 


民力 忆 2 


(a) 连续 编号 (b) 交叉 编号 
图 9.1 磁盘 扇 区 编号 方式 


【分 析 解 答 】 

交错 因子 是 指 每 两 个 连续 逻辑 扇 区 之 间 所 间隔 的 物理 扇 区 数 。 显 然 , 图 9.1(a) 所 示 的 
交错 因子 是 0, 图 9.1(b) 所 示 的 交错 因子 是 2。 交 错 因子 是 硬盘 低级 格式 化 时 ,需要 给 定 的 
一 个 主要 参数 ,具体 数值 视 硬 盘 类 型 而 定 。 交 错 因子 对 硬盘 的 存 取 速 度 有 很 大 影响 。 虽 然 
硬盘 的 物理 扇 区 在 磁道 上 是 连续 排列 的 ,但 进行 格式 化 后 的 逻辑 扇 区 却 是 交叉 排列 的 ,也 就 
是 说 ,连续 的 物理 扇 区 对 应 不 连续 的 逻辑 扇 区 。 

硬盘 每 当 访问 一 个 逻辑 扇 区 后 , 需 等 待 主机 将 该 扇 区 的 输出 数据 处 理 完毕 后 才能 进行 
下 一 个 肩 区 的 读 写 。 在 这 个 等 待 过 程 中 ,硬盘 可 能 已 经 转 过 了 几 个 物理 扇 区 。 如 果 交 错 因 
子 选 择 过 小 , 则 对 应 下 一 个 逻辑 扇 区 的 物理 扇 区 已 转 过 磁头 , 需 等 待 磁盘 再 转 一 圈 后 才能 读 
写 ; 如 果 交 错 因子 选取 过 大 , 则 对 应 下 一 个 逻辑 扇 区 的 物理 扇 区 还 未 转 到 磁头 处 ,需要 继续 
等 待 。 因 此 ,选择 合适 的 交错 因子 ,可 使 当前 扇 区 到 下 一 个 待 读 写 的 逻辑 扇 区 之 间 没 有 或 具 
有 最 短 的 等 待 时 间 ,从 而 明显 提高 硬盘 的 读 写 速度 。 因 此 ,图 9.1(b) 中 所 示 的 交叉 编号 方 
式 可 能 具有 更 好 的 性 能 。 

2. 假定 有 一 个 磁盘 存储 器 ,磁盘 片 外 径 为 355. 6mm, 有 20 个 记录 面 , 每 面 有 5l1mm 区 
域 用 于 记录 信息 , 道 密度 为 3. 92TPM( 道 /毫米 ), 位 密度 为 99BPM (位 /毫米 ), 转速 为 
2400RPM, 道 间 移 动 时 间 为 0.2ms。 请 问 : 

(1) 磁盘 容量 约 为 多 少 ? 如 果 道 密度 和 位 密度 同时 扩大 100 倍 , 则 容量 约 为 多 少 ? 

(2) 平均 存 取 时 间 和 平均 数据 传输 率 各 为 多 少 ? 

(3) 如 果 在 道 密度 和 位 密度 同时 扩大 100 倍 的 同时 转速 扩大 3 倍 , 则 平均 存 取 时 间 和 
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平均 数据 传输 率 各 为 多 少 ? 

【分 析 解 答 】 

(1) 每 面 磁道 数 为 51X3. 92 二 200 道 , 给 出 的 位 密度 是 指 最 内 圈 上 的 位 密度 。 所 以 ,最 
内 圈 周 长 为 3.14X(355. 6 一 2X51)、:796. 3mm, 故 每 道 信息 量 为 796. 3X902271664 位 , 因 
此 ,磁盘 容量 为 20X200X71664 一 286656000bz273Mb(1M 一 22)。 若 道 密度 和 位 密度 同 
时 扩大 100 倍 , 则 磁道 数 扩大 100 售 ,每 道 容量 扩大 100 倍 ,所 以 整个 盘 组 容量 扩大 
10000 倍 ,磁盘 容量 大 约 为 273MbX104<*2666Gb*z333GB(1G 一 28") 。 

(2) 平均 寻 道 时 间 为 (199X0.2 十 0)/2 王 19.9ms。 转 一 圈 时 间 为 60X10:/2400 二 25ms, 平 
均等 待 时 间 为 (25 十 0)/2 二 12. 5ms。 平 均 存 取 时 间 为 平均 寻 道 时 间 与 平均 等 待 时 间 之 和 ， 
即 19.9 十 12.5 一 32. 4ms。 平 均 数据 传输 率 为 71664X103/2522. 87Mb/s(1M=105)。 

(3) 道 密度 扩大 100 倍 , 则 平均 寻 道 时 间 约 为 (19999X0. 002 十 0)/2<20ms。 若 转速 扩 
大 3 倍 , 则 转 一 圈 的 时 间 缩短 为 25/3 二 8. 33ms, 平 均等 待 时 间 缩 短 为 8. 33/2 二 4. 2ms, 故 平 
均 存 取 时 间 为 20 十 4.2 二 24. 2ms。 位 密度 扩大 100 倍 , 则 每 道 容 量 扩大 100 倍 , 转 速 扩大 
3 倍 , 则 转 一 圈 的 时 间 缩 短 为 1/3, 因 此 ,平均 数据 传输 率 共 扩大 100 X 3= 300 倍 , 即 
300X2.87Mb/s=861Mb/s。 

3. 假定 一 个 程序 重复 完成 以 下 将 磁盘 上 一 个 4KB 的 数据 块 读 出 ,进行 相应 处 理 后 , 写 
回 到 磁盘 的 另外 一 个 数据 区 。 各 数据 块 内 信息 在 磁盘 上 连续 存放 ,数据 块 随机 地 位 于 磁盘 
的 一 个 磁道 上 。 磁 盘 转 速 为 7200RPM, 平 均 寻 道 时 间 为 10ms, 磁盘 最 大 数据 传输 率 为 
40MBps, 磁 盘 控制 器 的 开销 为 2ms, 没 有 其 他 程序 使 用 磁盘 和 处 理 器 ,并 且 磁 盘 读 写 操 作 和 
磁盘 数据 的 处 理 时 间 不 重 倒 。 若 程序 对 磁盘 数据 的 处 理 需 要 20000 个 时 钟 周期 ,处 理 器 时 
钟 频率 为 500MHz, 则 该 程序 完成 一 次 数据 块 “ 读 出 -处 理 - 写 回 ”操作 所 需要 的 时 间 为 多 少 ? 
每 秒 钟 可 以 完成 多 少 次 这 样 的 数据 块 操作 ? 

【分 析 解 答 】 

磁盘 转 一 圈 的 时 间 为 1000/7200A8. 33ms, 故 平均 等 待 时间 约 为 8.33/2 二 4, 17ms。 数 据 
块 内 信息 连续 存放 , 故 数据 块 传输 时 间 为 4X2”/(40X10)==0.1024ms, 因 而 数据 块 的 平均 
读 取 或 写 回 时 间 为 2ms 十 10ms 十 4. 17ms 十 0. 1024ms 守 16. 27ms。 数 据 块 的 处 理 时 间 为 
20000/500M 王 0.04ms。 因 为 数据 块 随机 存放 在 某 个 磁道 上 ,所 以 ,每 个 数据 块 的 “ 读 出 -处 
理 - 写 回 ?操作 时 间 都 是 相同 的 ,其 整个 时 间 为 16.27msX2 十 0. 04ms 一 32.58ms。 所 以 每 秒 
钟 可 以 完成 这 样 的 数据 块 操 作 次 数 是 1000ms/32. 58mss“30 次 。 

4. 假定 主 存 和 磁盘 存储 器 之 间 连 接 的 同步 总 线 具 有 以 下 特性 : 支持 4 字 和 16 字 两 种 
长 度 ( 字 长 32 位 ) 的 传送 ,总 线 时 钟 频率 为 200MHz, 总 线 宽 度 为 64 位 ,每 个 64 位 数据 的 传 
送 需 1 个 时 钟 周 期 ,向 主 存 发 送 一 个 地 址 需要 1 个 时 钟 周期 ,每 个 总 线 事务 之 间 有 2 个 空闲 
时 钟 周期 。 若 访问 主 存 时 最 初 4 个 字 的 存 取 时 间 为 200ns, 随后 每 存 取 一 个 4 字 的 时 间 是 
20ns, 磁 盘 的 数据 传输 率 为 5MB/s, 则 在 4 字 和 16 字 两 种 方式 下 ,该 总 线 上 分 别 最 多 可 有 
多 少 个 磁盘 同时 进行 传输 ? 

【分 析 解 答 】 

由 第 8 章 8. 6 节 分 析 应 用 题 6 可 知 ,在 4 字 传输 方式 下 ,总 线 数 据 传 输 率 为 71. 11MB/s， 
因为 71.11/5 一 14. 2, 所 以 ,该 总 线 上 最 多 可 以 有 14 个 磁盘 同时 进行 传输 。 在 16 字 传 输 方 
式 下 ,总 线 的 数据 传输 率 为 224. 56MB/s, 因 为 224. 56/5 二 44.9, 因 此 ,此 时 该 总 线 上 最 多 可 
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以 有 44 个 磁盘 同时 进行 传输 。 

5. 假定 有 两 个 用 来 存储 10TB 数据 的 RAID 系统 。 系 统 A 使 用 RAID1 技术 ,系统 BB 
使 用 RAID5 技术 。 

(1) 系统 A 比 系统 B 需 要 多 用 多 少 存储 容量 ? 

《2) 假定 某 个 应 用 需要 向 磁盘 写 人 一 块 数据 , 若 磁盘 读 或 写 一 块 数据 的 时 间 为 30ms， 
则 最 坏 情况 下 ,在 系统 A 和 系统 B 上 写 人 一 块 数据 分 别 需 要 多 长 时 间 ? 

《3) 哪个 系统 更 可 靠 ? 为 什么 ? 

【分 析 解 答 】 

《1) 系统 A 使 用 RAID1 技术 ,采用 磁盘 镜像 方式 存储 ,所 以 ,所 用 磁盘 容量 为 10 十 
10 二 20TB。 系 统 B 使 用 RAID5 技术 ,采用 一 个 奇偶 校 验 盘 , 假 设 使 用 5 个 磁盘 阵列 ,那么 
10TB 的 数据 需要 2. 5TB 来 存放 宛 余 的 奇偶 校 验 数据 ,所 以 系统 A 比 系统 B 多 用 7.5TB 存 
储 容量 。 

《2) 系统 A 的 写 人 速度 取决 于 两 个 磁盘 中 速度 慢 的 那个 ,因为 所 有 盘 写 一 块 数据 的 时 
间 都 是 30ms, 故 系统 A 写 和 一块 数据 的 时 间 是 30ms。 对 于 系统 B, 最 坏 的 情况 下 , 写 一 块 
数据 的 时 间 为 2 次 读 和 2 次 写 , 即 所 用 时 间 为 4X30 王 120ms。 

《3) 系统 A 更 可 靠 , 因 为 系统 对 整个 磁盘 都 进行 了 备份 ,所 以 即使 所 有 的 数据 都 损坏 了 
也 可 以 恢复 ,而 系统 B 只 是 记录 了 部 分 宛 余 信 息 , 如 果 两 个 磁盘 的 相同 位 都 损坏 了 就 恢复 
不 出 来 了 。 

6. 假定 在 一 个 使 用 RAID5 的 系统 中 ,采用 先 更 新 数据 块 \ 再 更 新 校 验 块 的 信息 更 新 方 
式 。 如 果 在 更 新 数据 块 和 更 新 校 验 块 的 操作 之 间 发 生 了 掉 电 现象 ,那么 会 出 现 什么 问题 ? 
采用 什么 样 的 信息 更 新 方式 可 避免 这 个 问题 ? 

【分 析 解 答 】 

对 于 RAID5 来 说 ,如 果 在 写 完 数据 块 但 未 写 人 校 验 块 时 发 生 断 电 , 则 写 人 的 数据 
和 对 应 的 校 验 信息 不 匹配 ,无 法 正确 恢复 数据 。 这 种 情况 可 以 避免 ,因为 RAID5 是 大 
数据 块 交 叉 方 式 ,每 个 盘 独 立 进行 操作 ,所 以 ,只 要 同时 写 数据 块 所 在 盘 和 校 验 块 所 在 
盘 即 可 。 

7. 某 终端 通过 RS-232 串 行 通 信 接 口 与 主机 相连 ,采用 起 止 式 异 步 通信 方式 , 若 传 输 速 
率 为 1200 波 特 , 采 用 两 相 调制 技术 ,通信 协议 为 8 位 数据 ,无 校 验 位 ,停止 位 为 1 位 ,请 回答 
下 列 问 题 : 

(1) 传送 一 个 字符 所 需 时 间 约 为 多 少 ? 

〈2) 若 传输 速度 为 2400 波 特 , 停 止 位 为 2 位 ,其 他 条 件 不 变 , 则 传输 一 个 字符 的 时 间 约 
为 多 少 ? 

C3) 若 采用 四 相 调制 技术 ,其 他 条 件 不 变 , 则 传输 一 个 字符 的 时 间 约 为 多 少 ? 

【分 析 解 答 】 

(1) 采用 两 相 调 制 技 术 , 比 特 率 二 波 特 率 。1200 波 特 说 明 每 秒 钟 传输 1200 个 信息 位 。 
每 个 字符 都 有 一 个 起 始 位 , 故 一 个 字符 有 1 十 8 十 1 二 10 位 ,因而 传输 一 个 字符 所 需 时 间 约 为 
10X (1/1200) X10:=8. 3ms。 

(2) 一 个 字符 有 11 位 ,传送 一 个 字符 的 时 间 约 为 11X (1/2400)X10=4. 6ms。 

《3) 采用 四 相 调 制 技术 ,每 个 码 元 调制 出 2 位 信息 ,因而 比特 率 为 波 特 率 的 两 倍 , 故 传 
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输 一 个 字符 所 需 时 间 约 为 10X(1/2400)X10? 一 4. 15ms。 

8. 假定 采用 独立 编 址 方式 对 IO 端口 进行 编号 ,那么 ,必须 为 处 理 器 设计 哪些 指令 来 
专门 用 于 进行 I/O 端口 的 访问 ? 连接 处 理 器 的 总 线 必 须 提 供 哪 些 控制 信号 来 表明 访问 的 
是 IO 空间 ? 

【分 析 解 答 】 

若 采 用 独立 编 址 方式 对 IO 端口 进行 编号 , 则 主 存 地 址 编号 和 I/O 端口 编号 可 能 会 相 
同 , 所 以 ,无 法 利用 访 存 指令 来 访问 IO 端口 ,必须 提供 专门 的 输入 /输出 指令 ,包括 IO 读 
指令 和 I/O 写 指令 。 在 执行 I/O 指令 时 ,CPU 会 送出 相应 的 IO 读 和 I/O 写 控 制 信号 ,以 
使 和 执行 访 存 指令 时 送出 的 存储 器 读 和 存储 器 写 信号 有 所 区 别 。 

9. 假设 有 一 个 磁盘 ,每 面 有 200 个 磁道 ,盘面 总 存储 容量 为 1. 6MB( 为 计算 方便 起 见 ， 
设 1M=10") ,磁盘 旋转 一 周 时 间 为 25ms, 每 道 有 4 个 数据 区 ,每 两 个 数据 区 之 间 有 一 个 间 
阶 , 磁 头 通 过 每 个 间隙 需 1. 25ms。 请 回答 下 列 问题 : 

(1) 从 该 磁盘 上 读 取 数 据 时 的 最 大 数据 传输 率 是 多 少 ? 

(2) 假如 有 人 为 该 磁盘 设计 了 一 个 与 主机 之 间 的 接口 ,如 图 9.2 所 示 , 磁 盘 每 读 出 一 
位 , 串 行 送 入 一 个 移 位 寄存 器 ,每 当 移 满 16 位 后 向 处 理 器 发 出 一 个 请 求 交 换 数 据 的 信号 。 
在 处 理 器 响应 该 请 求 信号 并 读 取 移 位 寄存 器 内 容 的 同时 ,磁盘 继续 读 出 下 一 位 数据 并 串 行 
送 入 移 位 寄存 器 ,如 此 继续 工作 。 已 知 处 理 器 在 接 到 请 求 交换 的 信号 以 后 ,最 长 响应 时 间 是 
3 微 秒 ,那么 ,这 样 设计 的 接口 能 否 正 确 工 作 ? 若 不 能 则 应 如 何 改进 ? 


区 4 区 1 


磁盘 读 入 一 一 | 16 位 移 位 寄存 器 


区 3 区 2 


图 9.2 题 9 的 示意 图 


【分 析 解 答 】 

(1) 磁道 容量 为 1.6X10s/200 王 8000B, 数 据 区 容量 为 8000/4 王 2000B, 转 过 数据 区 的 时 间 
为 (25 一 1.25X4)/4 二 5ms, 故 磁盘 最 大 数据 传输 率 为 2000B/5ms 一 0. 4MB/s。 

(2) 磁盘 传送 1 位 的 时 间 为 10;/《0.4X105 X8) 二 0.31ps 二 3ps。 因 为 传送 1 位 的 时 间 
小 于 3 微 秒 , 所 以 , 当 处 理 器 经 过 3ps 来 读 取 移 位 寄存 器 中 的 数据 时 ,磁盘 已 经 读 出 了 新 的 
数据 位 ,并 将 原先 请 求 被 读 的 在 移 位 寄存 器 中 的 数据 冲刷 掉 了 。 显 然 , 这 样 的 设计 接口 不 能 
正确 工作 。 磁 盘 读 出 一 个 字 (16 位 ) 所 用 时 间 为 2/(0.4X10) 二 5ps 之 3ps, 所 以 可 以 在 磁盘 
接口 中 增加 一 个 16 位 数据 缓冲 器 。 当 16 位 移 位 寄存 器 装 满 后 ,首先 送 入 数据 缓冲 寄存 器 ， 
在 读 出 下 一 个 16 位 数据 期 间 , 上 次 读 出 的 16 位 数据 从 数据 缓冲 器 中 被 取 走 。 

10. 假定 一 个 政府 机 构 同 时 监控 100 路 移动 电话 的 通话 消息 ,通话 消息 被 分 时 复 用 到 
一 个 带宽 为 4MBps 的 网 络 上 ,100 路 复 用 使 得 每 传送 IKB(IK 三 1024) 的 通话 消息 需 额 外 
开销 150ps, 若 通话 消息 的 采样 频率 为 4kHz(Ik 一 1000) ,每 个 样本 的 量化 值 占 16 位 。 请 回 
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答 下 列 问题 : 

(1) 要 求 计算 每 个 通话 消息 的 传输 时 间 , 并 判断 该 网 络 带 宽 能 否 支 持 同时 监控 100 路 
通话 消息 ? 

(2) 若 网 络 带宽 降 为 1MBps, 每 次 通话 消息 的 额外 开销 为 350ps, 则 该 系统 能 否 正确 工作 ? 

【分 析 解 答 】 

(1) 该 网 络 传输 1KB 的 通话 消息 所 需 时 间 为 150ps 十 10 X1024/(4X105) 一 406ps。 
所 以 ,一 秒 钟 内 网 络 可 传输 的 消息 个 数 为 10;/406 二 2463。 每 一 路 移动 电话 一 秒 钟 所 产生 
的 数据 量 为 000X2B= 8000B==7. 81KB, 所 以 ,100 路 移动 电话 在 一 秒 钟 内 所 产生 的 消息 
个 数 为 7.81X100=781, 因 为 781<<2463, 故 该 网 络 带宽 可 支持 同时 监控 100 路 通话 消息 。 

(2) 每 一 路 移动 电话 一 秒 钟 所 需 传 输 的 数据 量 为 4000X2B=8000B=7. 81KB， 
100 个 移动 电话 在 一 秒 钟 内 产生 的 数据 量 为 100X7. 81KB=781KB, 所 以 ,每 秒 钟 共产 生 
781 个 消息 。 如 果 不 考 虑 额外 开销 带 来 的 延迟 ,那么 ,每 秒 钟 产 生 781KB 的 信息 量 在 带宽 
为 1MB/s 的 网 络 上 传输 是 没有 问题 的 。 

但 是 ,由 于 多 路 复 用 带 来 了 额外 开销 ,使 得 该 网 络 传输 每 个 1KB 的 通话 消息 所 需 时 间 
为 350 十 105 X1024/(1X105) 王 1374ps 一 1. 374ms。 所 以 1 秒 钟 内 网 络 上 能 够 传输 的 消息 
最 多 只 有 1000ms/1. 374ms 一 740 个 ,而 100 个 移动 电话 在 一 秒 钟 内 共产 生 了 781 个 消息 
(所 需 时 间 为 781X1. 374mss*1070ms>1 秒 ) ,所 以 系统 不 能 正确 工作 。 

11. 假定 一 台 计 算 机 带 有 20 个 终端 同时 工作 ,在 运行 用 户 程 序 的 同时 ,能 接收 来 自任 
意 一 个 终端 输入 的 字符 信息 ,并 将 字符 回 送 显示 或 打印 。 每 一 个 终端 的 键盘 输入 部 分 有 一 
个 数据 缓冲 寄存 器 RDBRi(G 一 1 一 20) , 当 在 键盘 上 按 下 某 一 个 键 时 ,相应 的 字符 代码 即 进 
入 RDBR; ,并 使 它 的 “完成 ”状态 标志 Done,(i=1~20) 置 1, 要 等 处 理 器 把 该 字符 代码 取 走 
后 ,Done 标志 才 自 动 清 “0”( 复 位 )。 每 个 终端 显示 或 打印 输出 部 分 也 有 一 个 数据 缓冲 寄存 
器 TDBR;(i 二 1~20) ,并 有 一 个 Readyi(i 二 1~20) 状 态 标 志 , 该 状态 标志 为 1 时 ,表示 相应 
的 TDBR 是 空 着 的 ,准备 接收 新 的 输出 字符 代码 , 当 TDBR; 接收 了 一 个 字符 代码 后 ， 
Ready; 标志 自动 清 *0”, 并 将 字符 送 终端 显示 或 打印 。 为 了 接收 终端 的 输入 信息 ,处 理 器 为 
每 个 终端 设计 了 一 个 指针 PTR;(G 一 1 一 20) 指 向 为 该 终端 保留 的 主 存 输 入 缓冲 区 。 处 理 器 
采用 下 列 两 种 方案 输入 键盘 代码 ,同时 回 送 显示 或 打印 。 

(1) 每 隔 一 固定 时 间 个 转 人 一 个 状态 检查 程序 DEVCHC, 顺 序 地 检查 全 部 终端 是 否 有 
任何 键盘 信息 输入 ,如 果 有 , 则 顺序 完成 。 

(2) 允许 任何 有 键盘 信息 输入 的 终端 向 处 理 器 发 出 中 断 请 求 。 全 部 终端 采用 共同 的 向 
量 地 址 ,利用 它 使 处 理 器 在 响应 中 断后 , 转 和 一 个 中 断 服 务 程序 DEVINT, 由 后 者 询问 各 终 
端 状态 标志 ,并 为 最 先 遇 到 的 有 中 断 请 求 的 终端 服务 ,服务 结束 后 返回 用 户 程 序 。 

要 求 画 出 DEVCHC 和 DEVINT 两 个 程序 的 流程 图 。 

【分 析 解 答 】 

定时 查询 程序 DEVCHC 和 中 断 服 务 程序 DEVINT 的 流程 分 别 如 图 9. 3 和 图 9. 4 所 
示 。 图 中 用 (x) 表 示 寄 存 器 x 或 存储 单元 x 的 内 容 。x 可 能 是 存储 单元 地 址 或 寄存 器 编号 。 
此 外 ,因为 标志 Done; 和 Readyi 由 硬件 控制 自动 清 *0”( 复 位 ), 所 以 ,流程 图 中 不 需要 有 对 
这 两 个 标志 赋值 的 操作 。 程 序 DEVINT 的 流程 图 中 ,如 果 所 有 终端 都 检测 不 到 Done 标志 
为 1, 说 明 所 有 终端 都 没有 键盘 输入 , 即 都 没有 中 断 请求 , 此 时 不 应 该 进入 DEVINT 处 理 ， 
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因此 需 报告 “出 错 ”。 
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图 9.4 中 断 服务 程序 DEVINT 的 处 理 流 程 
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12. 车 某 计算 机 有 5 级 中 断 ,中 断 响应 优先 级 为 1 二 >2 二 3 这 4 二 5, 而 中 断 处 理 优先 级 为 
1>4>5>>2>3。 要 求 : 

(1) 设计 各 级 中 断 服务 程序 的 中 断 屏 项 位 (假设 1 为 屏 项 ,0 为 开放 ) 。 

《2) 车 在 运行 用 户 程序 时 ,同时 出 现 第 2、4 级 中 断 请 求 ,而 在 处 理 第 2 级 中 断 过 程 中 ， 
又 同时 出 现 1.3、5 级 中 断 请 求 , 试 画 出 此 时 CPU 运行 过 程 示意 图 。 

【分 析 解 答 】 

(1) 由 题 意 可 知 ,1 级 中 断 的 处 理 优先 级 最 高 ,说 明 1 级 中 断 对 其 他 所 有 中 断 都 屏蔽 ,其 
屏蔽 字 为 全 1;3 级 中 断 的 处 理 优先 级 最 低 , 所 以 除了 3 级 中 断 本 身 之 外 ,对 其 他 中 断 全 都 开 
放 , 其 屏 若 字 为 00100。 以 此 类 推 , 得 到 所 有 各 级 中 断 的 中 断 服务 程序 中 设置 的 中 断 屏 项 字 
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如 表 9. 1 所 示 。 
表 9.1 题 12 的 中 断 屏蔽 字 
中 断 处 理 程序 EE 
第 1 级 第 2 级 第 3 级 第 4 级 第 5 级 


(2) 在 运行 用 户 程序 时 ,同时 出 现 2、4 级 中 断 请 求 , 因 为 用 户 程序 对 所 有 中 断 都 开放 ， 
所 以 ,在 中 断 响 应 优先 级 排队 电路 中 ,有 2、4 两 级 中 断 进 行 排队 判 优 ,根据 中 断 响应 优先 级 
2>4, 因 此 先 响应 2 级 中 断 。 在 CPU 执行 2 级 中 断 服务 程序 过 程 中 ,首先 保护 现场 .保护 旧 
屏蔽 字 、 设 置 新 的 屏蔽 字 01100, 然 后 ,在 具体 中 断 处 理 前 先 开 中 断 。 一 旦 开 中 断 , 则 马上 响 
应 4 级 中 断 , 因 为 2 级 中 断 屏 项 字 中 对 4 级 中 断 的 屏 项 位 是 0, 即 对 4 级 中 断 是 开放 的 。 在 
执行 4 级 中 断 结束 后 , 回 到 2 级 中 断 服务 程序 执行 ;在 具体 处 理 2 级 中 断 过 程 中 ,同时 发 生 
了 1、3、5 级 中 断 请 求 , 因 为 2 级 中 断 对 1、5 级 中 断 开 放 , 对 3 级 中 断 屏 项 ,所 以 只 有 1 和 5 两 
级 中 断 进 行 排队 判 优 ,根据 中 断 响 应 优先 级 1 汪 >5, 所 以 先 响应 1 级 中 断 。 因 为 1 级 中 断 处 
理 优 先 级 最 高 ,所 以 在 其 处 理 过 程 中 不 会 响应 任何 新 的 中 断 请 求 , 直 到 1 级 中 断 处 理 结束 ， 
然后 返回 2 级 中 断 ;因为 2 级 中 断 对 5 级 中 断 开放 ,所 以 在 2 级 中 断 服 务 程序 中 执行 一 条 指 
令 后 ,又 转 去 执行 5 级 中 断 服 务 程序 ,执行 完 后 回 到 2 级 中 断 , 在 2 级 中 断 服务 程序 执行 过 
程 中 ,虽然 3 级 中 断 有 请 求 , 但 是 ,因为 2 级 中 断 对 3 级 中 断 不 开放 ,所 以 ,3 级 中 断 一 直 得 
不 到 响应 。 直 到 2 级 中 断 处 理 完 回 到 用 户 程序 ,才能 响应 并 处 理 3 级 中 断 。CPU 运行 程序 
的 执行 过 程 如 图 9. 5 所 示 。 

5 级 中 断 服务 程序 
4 级 中 断 服 务 程序 
3 级 中 断 服务 程序 
2 级 中 断 服务 程序 ; 
1 级 中 断 服务 程序 | 


省 
J 


用 户 程序 一 一 一 四 


图 9.5 CPU 运行 程序 的 执行 过 程 


13. 某 计 算 机 的 CPU 主 频 为 500MHz, 所 连接 的 某 外 设 的 最 大 数据 传输 率 为 20kBps， 
该 外 设 接口 中 有 一 个 16 位 的 数据 缓存 器 ,相应 的 中 断 服务 程序 的 执行 时 间 为 500 个 时 钟 周 
期 。 请 回答 下 列 问题 : 

(1) 是 否 可 用 中 断 方式 进行 该 外 设 的 输入 输出 ? 若 能 ,在 该 设备 持续 工作 期 间 , CPU 
用 于 该 设备 进行 输入 /输出 的 时 间 占 整个 CPU 时 间 的 百分比 大 约 为 多 少 ? 

(2) 若 该 外 设 的 最 大 数据 传输 率 是 2MBps, 则 可 否 用 中 断 方式 进行 输入 输出 ? 


人 


【分 析 解 答 】 

(1) 因为 该 外 设 接 口中 有 一 个 16 位 数据 缓存 器 ,所 以 , 若 用 中 断 方式 进行 输入 /输出 ， 
可 以 每 16 位 进行 一 次 中 断 请 求 , 因 此 ,中 断 请 求 的 时 间 间 隔 为 10* X2B/20kB=100ps。 

对 应 的 中 断 服务 程序 的 执行 时 间 为 (105/500M) X500=1ps, 因 为 中 断 响应 过 程 就 是 执 
行 一 条 隐 指 令 的 过 程 , 所 用 时 间 相 对 于 中 断 处 理 时 间 ( 执 行 中 断 服 务 程 序 的 时 间 ) 而 言 , 几 乎 
可 以 忽略 不 计 , 因 而 整个 中 断 响 应 并 处 理 的 时 间 大 约 为 lns 多 一 点 , 远 远 小 于 中 断 请求 的 间 
隔 时 间 。 因 此 ,可 以 用 中 断 方式 进行 该 外 设 的 输入 输出 。 

车 用 中 断 方式 进行 该 设备 的 输入 /输出 , 则 该 设备 持续 工作 期 间 ,CPU 用 于 该 设备 进行 
输入 /输出 的 时 间 占 整个 CPU 时 间 的 百分比 大 约 为 1/100 二 1%。 

也 可 以 通过 考察 1 秒 钟 内 500M 个 时 钟 周期 中 有 多 少时 钟 周期 用 于 中 断 来 计算 百 分 
比 , 其 结果 为 (105/100X500)/500M 一 1% 。 

(2) 若 外 设 的 最 大 传输 率 为 2MBps, 则 中 断 请 求 的 时 间 间 隔 为 10* X2B/2MB= 1ps。 
而 整个 中 断 响 应 并 处 理 的 时 间 大 约 为 lps 多 一 点 ,中 断 请 求 的 间隔 时 间 小 于 中 断 响 应 和 处 
理 时 间 , 即 中 断 处 理 还 未 结束 就 会 有 该 外 设 新 的 中 断 到 来 ,所 以 不 可 以 用 中 断 方式 进行 该 外 
设 的 输入 输出 。 

14. 假设 某 计算 机 中 软盘 以 中 断 方式 进行 数据 输入 /输出 ,每 次 中 断 请 求 传输 一 个 
32 位 数 。 已 知 软盘 的 数据 传输 率 为 500kB/s, 每 次 传输 的 CPU 开销 (包括 中 断 响 应 和 处 
理 ) 为 1000 个 时 钟 周期 ,CPU 的 主 频 为 500MHz, 则 软盘 在 持续 工作 时 ,CPU 用 于 软盘 数据 
传送 的 时 间 占 CPU 整个 时 间 的 百分比 是 多 少 ? 

【分 析 解 答 】 

软盘 准备 32 位 数据 的 时 间 为 10* X4B/500kB 二 8ps。 因 此 ,软盘 每 隔 8 微 秒 发 一 次 中 
断 请 求 ,CPU 响应 并 处 理 中 断 所 用 时 间 为 1000X10/(500X10) 二 2js, 因 此 ,每 次 CPU 花 
2hs 取 走 数据 后 ,就 去 执行 其 他 程序 ;过 8ps 后 软盘 又 准备 好 下 一 个 数据 ,又 发 中 断 请 求 ， 
CPU 响应 并 处 理 中 断 以 取 走 数据 ,然后 又 去 执行 其 他 程序 ;…… ,如 此 周而复始 ,直到 所 有 
需要 的 数据 传送 完 。 因 此 , 当 软 盘 持续 工作 时 ,CPU 用 于 软盘 数据 传送 的 时 间 占 CPU 总 时 
间 的 百分比 是 2/8==0. 25 二 25% 。 

15. 某 计算 机 CPU 主 频 为 500MHz,CPI 为 5。 假定 某 外 设 的 数据 传输 率 为 0.5MB/s, 采 
用 中 断 方式 与 主机 进行 数据 传送 ,传输 单位 为 32 位 ,对 应 的 中 断 服务 程序 包含 18 条 指令 ,中 
断 响应 等 其 他 开销 相当 于 两 条 指令 的 执行 时 间 。 请 回答 下 列 问题 ,要 求 给 出 计算 过 程 。 

(1) 在 中 断 方式 下 ,CPU 用 于 该 外 设 I/O 的 时 间 占 整个 CPU 时 间 的 百分比 是 多 少 ? 

(2) 当 该 外 设 的 数据 传输 率 达 到 5MB/s 时 , 改 用 DMA 方式 传送 数据 。 假 定 每 次 
DMA 传送 的 块 大 小 为 5000B, DMA 预 处 理 和 后 处 理 的 总 开销 为 500 个 时 钟 周期 , 则 CPU 
用 于 该 外 设 IO 的 时 间 占 整个 CPU 时 间 的 百分比 是 多 少 ? (假设 DMA 与 CPU 之 间 没 有 
访 存 冲 突 ) 

【分 析 解 答 】 

(1) 中 断 方式 下 ,每 当 外 设 准 备 好 32 位 数据 ( 读 操作 ) 或 外 设 接口 中 的 32 位 数据 缓存 
为 空 已 准备 好 接收 新 数据 ( 写 操作 ) 时 ,就 向 CPU 发 中 断 申 请 ,要 求 CPU 通过 执行 中 断 服 
务 程序 来 取 走 缓存 中 的 32 位 数据 或 向 缓存 送 32 位 数据 。 

CPU 每 次 执行 中 断 服务 程序 花 18 条 指令 的 时 间 , 其 他 如 中 断 响 应 等 的 开销 相当 于 
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两 条 指令 的 时 间 ,CPI 为 5。 因此 ,每 次 CPU 用 于 中 断 处 理 ( 数 据 传 送 服务 ) 的 时 钟 周期 数 
为 5X18 十 5X2 一 100。 

外 设 的 数据 传输 率 为 0. 5 MB/s, 每 次 中 断 传 送 32 位 数据 , 占 4 个 字 节 ,因此 ,外 设 每 秒 
钟 申请 的 中 断 次 数 为 0.5MB/4B 王 125000, 因 而 每 秒 钟 内 CPU 用 于 中 断 响应 和 处 理 的 时 间 
开销 为 100 X 125000 王 12500000 王 12. 5M 个 时 钟 周 期 ,CPU 的 时 钟 频率 为 500MHz, 即 
CPU 每 秒 钟 内 产生 500M 个 时 钟 周期 , 故 CPU 用 于 外 设 IO 的 时 间 占 整个 CPU 时 间 的 百 
分 比 为 12. 5M/500M 一 2.5%% (也 可 通过 考察 相 邻 两 次 中 断 请 求 间 隔 时 间 内 CPU 用 于 中 断 
的 时 间 来 计算 , 即 (100X1/500MD)/(4B/0. 5MB) 二 2. 5%)。 

(2) 当 外 设 数据 传输 率 提高 到 5MB/s 时 ,1 秒 钟 内 产生 的 DMA 次 数 为 5MB/5000B 一 
1000; 每 次 DMA 传送 前 都 需要 进行 DMA 初始 化 ( 预 处 理 ),DMA 结束 后 还 要 进行 中 断 处 
理 ( 后 处 理 ) ,已 知 这 两 个 处 理 总 共 需 要 500 个 时 钟 周期 ,所 以 ,CPU 用 于 DMA 处 理 的 总 开 
销 为 1000X500= 二 500000= 二 0. 5M 个 时 钟 周 期 ;而 CPU 的 时 钟 频率 为 500MHz, 即 CPU 每 
秒 钟 内 产生 500M 个 时 钟 周期 , 故 CPU 用 于 该 外 设 1/O 的 时 间 占 整个 CPU 时 间 的 百分比 
为 0.5M/500M 王 0.1%( 也 可 通过 考察 相 邻 两 次 DMA 请 求 间隔 时 间 内 CPU 用 于 该 外 设 
I/O 的 时 间 来 计算 , 即 (500X1/500M)/(5000B/5MB)==0.1%)。 

16. 假设 某 计 算 机 字 长 16 位 ,没有 cache, 运 算 器 一 次 定点 加 法 时 间 等 于 100 毫 微 秒 ， 
配置 的 磁盘 旋转 速度 为 每 分 钟 3000 转 ,每 个 磁道 上 记录 两 个 数据 块 ,每 一 块 有 8000 个 字 
节 , 两 个 数据 块 之 间 间 隙 的 越过 时 间 为 2 毫秒 , 主 存 存储 周期 为 500 毫 微 秒 , 存 储 器 总 线 宽 
度 为 16 位 。 

(1) 磁盘 读 写 数据 时 的 最 大 数据 传输 率 是 多 少 ? 平均 数据 传输 率 是 多 少 ? 

(2) 若 磁 盘 按 最 大 数据 传输 率 与 主 存 交换 数据 时 CPU 没有 访问 主 存 , 则 此 时 主 存 频带 
空闲 百分比 是 多 少 ?〈 主 存 频带 空闲 百分比 指 无 数据 读 写 的 空闲 存储 周期 数 占 所 有 存储 周 
期 总 数 的 百分比 ) 

(3) 直接 寻 址 的 “存储 器 -存储 器 ”SS 型 加 法 指令 在 无 磁盘 1/O 操作 打扰 时 的 执行 时 间 
为 多 少 ? 此 时 , 主 存 频带 空闲 百分比 是 多 少 ? 当 磁 盘 I/O 操作 与 一 连 串 这 种 SS 型 加 法 指 
令 执 行 同时 进行 时 ,这 种 SS 型 加 法 指令 的 最 快 和 最 慢 执行 时 间 各 是 多 少 ? (假定 采用 多 周 
期 处 理 器 方式 ,CPU 时 钟 周期 等 于 主 存 周 期 

【分 析 解 答 】 

(1) 磁盘 旋转 一 周 所 需 时 间 为 60 X 103/3000 = 20ms, 单 个 数据 块 的 传输 时 间 为 
(20ms/2) 一 2ms 一 8ms, 所 以 最 大 数据 传输 率 为 8000B/8ms 二 1MBps。 平 均 数据 传输 率 为 
2X8000B/20ms 一 0.8MBps。 

(2) 因为 磁盘 最 大 数据 传输 率 为 1MBps, 存 储 器 总 线 宽度 为 16bit 一 2B, 所 以 ,每 隔 
10?X2B/1MB 一 2000ns 产生 一 个 DMA 请 求 , 即 每 2000ns/500ns 二 4 个 主 存 周期 中 有 一 个 
被 DMA 挪用 ,此 时 ,CPU 没有 访问 主 存 ,因此 ,4 个 主 存 周 期 中 有 3 个 空闲 , 故 主 存 频 带 空 
闲 百分比 是 75% ,如 图 9. 6 所 示 。 图 中 箭头 处 开始 的 一 个 主 存 周期 被 DMA 挪用 。 
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图 9.6 无 CPU 访 存 时 主 存 周期 被 DMA 使 用 的 情况 


省 入 伯 册 和 如， 


(3) 无 磁盘 IO 打扰 时 ,执行 一 条 直接 寻 址 的 SS 型 加 法 指令 时 主 存 被 CPU 访问 的 过 
程 如 图 9.7 所 示 。 该 指令 执行 过 程 包 括 取 指令 、 取 源 操作 数 1、 取 目 操 作 数 ( 源 操作 数 2)、 执 
行 、 写 结果 , 共 需 5 个 时 钟 周期 ,因此 执行 时 间 为 5X500ns 一 2. 5us。 此 时 ,每 个 指令 周期 所 
包含 的 5 个 时 钟 周期 中 ,只 有 执行 阶段 不 访问 主 存 ,所 以 主 存 频带 空闲 百分比 是 20%。( 图 
中 箭头 处 即 一 条 指令 的 第 一 个 时 钟 周 期 开始 
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图 9.7 无 磁盘 1/O 打扰 时 主 存 周 期 被 CPU 使 用 的 情况 
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当 磁盘 W/O 操作 与 一 连 串 这 种 SS 型 加 法 指令 同时 进行 时 ,可 能 因为 CPU 和 DMA 同 
时 访 存 而 使 指令 的 执行 时 间 被 延长 。 每 次 DMA 请 求 要 求 挪用 一 个 主 存 周期 来 访问 主 存 ， 
同时 ,CPU 执行 指令 时 也 要 求 访问 主 存 , 当 两 者 发 生 冲 突 时 ,DMA 优先 级 高 ,CPU 的 访 存 
请 求 被 延迟 响应 。 因 为 每 隔 2000ns 产生 一 个 DMA 请 求 ,因此 每 4 个 主 存 周 期 必定 有 一 个 
被 DMA 所 挪用 。 此 时 , 主 存 周期 的 占用 情况 如 图 9. 8 所 示 。 
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图 9.8 CPU 和 DMA 交替 串 行 访问 主 存 时 的 情况 


由 图 9. 8 可知, 最 好 的 情况 是 在 SS 型 加 法 指令 执行 过 程 中 没有 访 存 冲突 (如 图 9. 8 中 
最 开始 的 一 个 指令 周期 ) ,此 时 最 快 ,指令 执行 时 间 为 2. 5ps; 最 坏 的 情况 是 有 一 次 访 存 冲 突 
(如 图 9. 8 中 第 二 个 指令 周期 ), 此 时 最 慢 , 指 令 执行 时 间 为 2. 5ps 十 500ns 二 3ps。 

17. 假设 某 计 算 机 所 有 指令 都 可 用 两 个 总 线 周期 完成 ,一 个 总 线 周期 用 来 取 指 令 , 男 一 
个 总 线 周期 用 来 存 取 数据 。 假 定 总 线 宽度 为 8 位 ,每 个 总 线 周期 为 250ns, 因 而 每 条 指令 的 
执行 时 间 为 500ns。 若 该 计算 机 中 配置 的 磁盘 每 个 磁道 有 16 个 512 字 节 的 扇 区 ,磁盘 旋转 
一 圈 的 时 间 是 8. 192ms。 请 回答 下 列 问题 。 

(1) 在 磁盘 不 工作 时 , 主 存 频带 空闲 百分比 是 多 少 ? 

(2) 若 采 用 周期 挪用 法 进行 DMA 传送 , 则 该 计算 机 执行 指令 的 速度 由 于 DMA 传送 而 
降低 了 多 少 ? 

(3) 若 采用 周期 挪用 法 进行 DMA 传送 ,总 线 宽度 改 为 16 位 , 则 该 计算 机 执行 指令 的 
速度 由 于 DMA 传送 而 降低 了 多 少 ? 

【分 析 解 答 】 

(1) 因为 所 有 指令 的 每 个 阶段 都 要 访问 主 存 , 所 以 即使 没有 磁盘 访问 主 存 , CPU 也 把 
主 存 周期 占 满 了 。 因 此 , 主 存 频 带 空闲 百分比 是 0。 

(2) 磁盘 的 平均 数据 传输 率 为 10; X16X512B/8. 192 二 1MBps。 当 总 线 位 宽 为 8 位 时 ， 
DMA 控制 器 每 隔 1B/1MB 二 1ps 申请 一 次 数据 传送 ,在 1ps 期 间 CPU 共 执 行 lps/500ns 一 
2 条 指令 。 因 此 ,每 两 条 指令 的 执行 被 插入 一 个 总 线 周 期 用 于 一 次 数据 传送 , 即 平均 每 条 指 
令 延 长 了 250/2 二 125ns。 因 而 ,计算 机 执行 指令 的 速度 降低 了 125/500 二 25%。 

(3) 当 总 线 位 宽 为 16 位 时 ,DMA 控制 器 每 隔 2B/1MB==2js 申请 一 次 数据 传送 ,在 
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2ns 期 间 CPU 共 执 行 2us/500ns 一 4 条 指令 ,因此 ,每 4 条 指令 的 执行 被 插入 一 个 总 线 周期 
用 于 一 次 数据 传送 , 即 平均 每 条 指令 延长 了 250/4 一 62. 5ns。 因 而 ,计算 机 执行 指令 的 速度 
降低 了 62.5/500 二 12. 5%。 

18. 假设 一 个 主 频 为 1GHz、CPI 为 5 的 CPU 需要 从 某 个 成 块 传送 的 MO 设备 读 取 
1000 字 节 的 数据 到 主 存 缓冲 区 中 ,该 IO 设备 一 旦 启动 即 按 50kBps 的 数据 传输 率 向 主机 
传送 1000 字 节 数据 ,每 个 字 节 的 读 取 、 处 理 并 存 人 内 存 缓冲 区 需要 1000 个 时 钟 周期 , 则 以 
下 4 种 方式 下 ,在 1000 字 节 的 读 取 过 程 中 ,CPU 用 在 该 设备 的 1/O 操作 上 的 时 间 分 别 为 多 
少 ? 占 整 个 CPU 时 间 的 百分比 分 别 是 多 少 ? 

(1) 采用 定时 查询 方式 ,每 次 处 理 一 个 字 节 ,一 次 状态 查询 至 少 需 要 60 个 时 钟 周期 。 

(2) 采用 独占 查询 方式 ,每 次 处 理 一 个 字 节 ,一 次 状态 查询 至 少 需 要 60 个 时 钟 周期 。 

《3) 采用 中 断 I/O 方式 ,外 设 每 准备 好 一 个 字 节 发 送 一 次 中 断 请 求 。 每 次 中 断 响 应 需 
要 2 个 时 钟 周期 ,中 断 服 务 程序 的 执行 需要 1200 个 时 钟 周期 。 

(4) 采用 周期 挪用 DMA 方式 ,每 挪用 一 次 主 存 周期 处 理 一 个 字 节 ,一 次 DMA 传送 完 
成 1000 字 节 的 数据 传送 ,DMA 初始 化 和 后 处 理 的 时 间 为 2000 个 时 钟 周期 ,CPU 和 DMA 
之 间 没 有 访 存 冲突 。 

(5) 如 果 设备 的 速度 提高 到 5MBps, 则 上 述 4 种 方式 中 ,哪些 是 不 可 行 的 ? 为 什么 ?对 
于 可 行 的 方式 ,计算 出 CPU 在 该 设备 I/O 操作 上 所 用 的 时 间 占 整个 CPU 时 间 的 百分比 。 

(6) 如 果 外 设 不 是 成 块 传送 设备 ,而 是 字符 型 设备 ,CPU 每 处 理 完 一 个 字 节 后 都 要 重 
新 启动 外 设 , 外 设 在 启动 后 0.02ms 时 间 内 准备 好 一 个 字 节 。 每 个 字 节 的 读 取 、 处 理 ( 包 括 
启动 下 一 次 操作 并存 人 内 存 缓冲 区 还 是 需要 1000 个 时 钟 周期 ,假定 CPU 总 是 在 查询 到 就 
绪 后 立即 启动 外 设 或 在 中 断 服务 程序 执行 了 20 条 指令 后 启动 外 设 , 则 在 (1)~(3) 三 种 方式 
下 ,CPU 在 该 设备 的 IO 操作 上 所 用 的 时 间 占 整个 CPU 时 间 的 百分比 分 别 是 多 少 ? 

《7) 对 以 上 各 种 情况 进行 分 析 后 ,你 可 以 得 出 哪些 结论 ? 

【分 析 解 答 】 

主 频 为 1GHz, 所 以 ,时 钟 周 期 为 /11GHz= lns。 因 为 每 个 字 节 的 读 取 、 处 理 并 存 人 内 
存 缓冲 区 需要 1000 个 时 钟 周期 ,所 以 ,对 于 像 程 序 查询 和 中 断 等 用 软件 实现 输入 /输出 的 方 
式 ,CPU 为 每 个 字 节 传送 所 用 的 时 间 至 少 为 1000X lns=1ns。 在 50kBps 的 数据 传输 率 
下 ,设备 每 隔 (10* X1B/50kB) 一 20ps 一 20000ns 准备 好 一 个 字 节 ,因而 1000 字 节 的 传输 时 
间 为 1000X20ps 一 20ms。 

(1) 定时 查询 方式 下 的 I/O 过 程 如 图 9. 9 所 示 。 可 以 设置 每 隔 20000ns 查询 一 次 ,这 
样 使 得 查询 程序 的 开销 达到 最 小 , 即 第 一 次 读 取 状 态 时 就 可 能 发 现 就 绪 , 然 后 用 1000 个 时 
钟 周期 进行 相应 处 理 , 因 此 ,对 于 每 个 字 节 的 传送 ,CPU 所 用 时 钟 周期 数 为 60 十 1000 一 
1060。 因 此 ,在 1000 个 字 节 的 读 取 过 程 中 ,CPU 用 在 该 设备 的 I/O 操作 上 的 时 间 至 少 为 
1000X1060X1lns 二 1. 060ms, 占 整个 CPU 时 间 的 百分比 至 少 为 1.060/20 二 5.3%。 
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图 9.9 定时 查询 方式 下 的 1/O 过 程 
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(2) 独占 查询 方式 下 的 I/O 过 程 如 图 9. 10 所 示 。 启 动 设备 后 ,CPU 就 开始 查询 ,因为 
333X60 十 20 二 20000, 所 以 第 一 个 字 节 传送 在 第 334 次 读 取 状态 时 检测 到 就 绪 , 随 后 用 
1000 个 时 钟 周期 进行 相应 的 处 理 ,然后 继续 第 2 个 字 节 的 状态 查询 。 因 为 40 十 1000 十 
316X60 二 20000, 所 以 ,第 2 个 字 节 的 传送 在 第 316 次 读 取 状 态 时 检测 到 就 绪 , 第 1 和 第 
2 个 字 节 的 传送 过 程 如 图 9.10(a) 所 示 。 每 次 检测 到 就 绪 后 ,就 进行 相应 的 处 理 ,然后 周 而 
复 始 地 进行 查询 ,因为 (20000 一 1000)/60 二 316.7, 所 以 ,第 317 次 读 取 状态 时 发 现 就 绪 。 因 
为 1000 十 60X317 一 20000= 二 20, 所 以 ,每 3 个 字 节 可 多 60 个 时 钟 周 期 ,正好 进行 一 次 状态 
查询 ,因此 ,在 剩 下 的 998 个 字 节 的 读 取 过 程 中 ,前 996 个 字 节 的 传送 正好 用 了 996X20000 个 
时 钟 周期 , 如 图 9. 10(b) 所 示 。 最 后 两 个 字 节 的 传送 过 程 如 图 9. 10(c) 所 示 , 因 为 
2X(1000 十 60X317 一 20000) 王 40, 此 外 ,最 后 一 个 字 节 的 处 理 还 需 1000 个 时 钟 周期 ,所 以 
最 后 两 个 字 节 总 的 时 间 为 2X20000 十 40 十 1000 一 41040 个 时 钟 周 期 。 综 上 所 述 ,CPU 用 在 
该 设备 的 I/O 操作 上 的 总 时 间 为 (1000X20000 十 1040) X 1ns 二 20. 00104mssx:20ms。 即 在 
1000 字 节 的 整个 传输 过 程 中 , CPU 一 直 为 该 设备 服务 ,所 用 时 间 占 整个 CPU 时 间 
的 100%。 


上 -一 | 一 | 一 关上- 一 一 一 -一 一 | 
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周而复始 进行 状态 查询 | 就 绪 | 
曲 和 2 20000 设备 完成 20000 就 绪 
坟 舍 


(a) 前 两 个 字 节 的 查询 过 程 
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周而复始 进行 状态 查询 | 就 绪 | 
就 绪 20000 设备 完成 fe 就 绪 
(b) 中 间 996 个 字 节 的 查询 过 程 
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(6) 最 后 两 个 字 节 的 查询 过 程 
图 9.10 独占 查询 方式 下 的 I/O 过 程 


(3) 中 断 方式 下 的 IO 过 程 如 图 9. 11 所 示 。 中 断 方式 下 ,外 设 每 准备 好 一 个 字 节 
请 求 一 次 中 断 , 每 次 中 断 CPU 所 用 时 钟 周 期 数 为 2 十 1200=1202, 因 此 CPU 用 在 该 设 
备 的 I/O 操作 上 的 时 间 为 1000X1202X1ns 二 1. 202ms, 占 整个 CPU 时 间 的 百分比 至 
少 为 1.202/20 一 6.01% 。 
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9.11 中 断 方式 下 的 1/O 过 程 
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(4) DMA 方式 下 ,由 于 CPU 和 DMA 没有 访 存 冲突 ,所 以 不 需 考虑 由 于 DMA 而 影响 
到 CPU 执行 其 他 程序 。 因 此 ,传送 1000 个 字 节 CPU 所 用 的 时 钟 周 期 数 就 是 2000, 在 1000 
个 字 节 的 读 取 过 程 中 ,CPU 用 在 该 设备 的 I/O 操作 上 的 时 间 为 2000X lns 一 2ps, 占 整个 
CPU 时 间 的 百分比 为 2/(1000X20) 二 0.01%。 

(5) 若 数据 传输 率 为 5MBps, 则 1000 字 节 的 传输 时 间 为 10 X1000B/5MB= 二 200ps。 

对 于 定时 查询 和 独占 查询 方式 ,传送 1000 字 节 CPU 所 用 时 间 至 少 为 1000X (60 十 
1000) X1ns 二 1060ps; 对 于 中 断 方式 ,传送 1000 字 节 CPU 所 用 时 间 为 1000X (2 十 1200) x 
lns 二 1202ps。 上 述 3 种 方式 下 ,CPU 所 用 的 时 间 都 比 设备 所 用 的 传输 时 间 长 得 多 , 即 设备 
的 传输 比 CPU 的 处 理 快 得 多 ,因而 发 生 数据 丢失 。 因 此 ,这 3 种 方式 都 不 能 用 于 该 设备 的 
LO 操作 。 对 于 DMA 方式 ,传送 1000 字 节 CPU 所 用 时 间 为 2000 X lns 二 2ps, 占 整个 
CPU 时 间 的 百分比 为 2/200 二 1% ,说 明 可 以 使 用 DMA 方式 ,不 过 由 于 外 设 传输 速度 加 快 ， 
使 得 CPU 频繁 进行 DMA 预 处 理 和 后 处 理 , 因 而 CPU 的 开销 从 0.01% 上 升 到 了 1%。 

(6) 对 于 字符 型 设备 ,在 定时 查询 方式 下 ,其 数据 传送 过 程 如 图 9. 12 所 示 。CPU 可 以 
每 隔 0.02ms( 相 当 于 20000 个 时 钟 周 期 ) 查 询 一 次 ,这 样 总 是 在 第 一 次 查询 时 就 发 现 就 绪 ， 
马上 启动 设备 进行 下 一 个 字 节 的 传送 ,并 读 取 和 处 理 当 前 字 节 。 因 此 ,传送 1000 个 字 节 
CPU 所 用 时 间 至 少 为 1000X (1000 十 60) Xlns 二 1060js 二 1.06ms, 而 设备 传输 1000 字 节 
所 用 时 间 为 0.02msX1000 二 20ms, 因 此 占用 CPU 时 间 的 百分比 至 少 为 1.06/20==5.3%。 
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图 9.12 字符 型 设备 定时 查询 方式 下 的 I/O 过 程 


在 独占 查询 方式 下 ,其 数据 传送 过 程 如 图 9.13 所 示 。 第 一 个 字 节 传送 在 第 334 次 读 取 
状态 时 检测 到 就 绪 , 随 后 启动 外 设 ; 在 外 设 工作 的 同时 ,查询 程序 用 1000 个 时 钟 周期 进行 相 
应 的 处 理 , 然 后 周而复始 地 进行 查询 ,因为 20000 一 1000/60 二 316.7, 所 以 ,对 于 后 面 的 999 
个 字 节 ,每 当 进行 到 第 317 次 状态 查询 时 发 现 就 绪 。 对 于 最 后 一 个 字 节 ,外 设 就 绪 后 CPU 
还 需要 1000 个 时 钟 对 其 进行 处 理 。 因 此 ,在 1000 个 字 节 的 读 取 过 程 中 ,CPU 用 在 该 设备 VO 
操作 的 时 间 为 (334X60 十 999X (1000 十 60X 317) 十 999 X1000) X lns 一 20. 02102ms 守 20ms。 
这 种 情况 下 ,该 设备 的 I/O 操作 占用 CPU 的 时 间 为 100%。 
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图 9.13 字符 型 设备 独占 查询 方式 下 的 I/O 过 程 


在 中 断 方式 下 ,其 数据 传送 过 程 如 图 9. 14 所 示 。 传 送 1000 个 字 节 CPU 所 用 时 间 为 
1.202ms。 因 为 中 断 响应 需 2 个 时 钟 周 期 ,并且 中 断 服务 程序 执行 了 20 条 指令 后 开始 启动 
外 设 , 所 以 外 设 每 次 中 断 请求 的 时 间 间 隔 为 (2 十 20X5) X lns 十 20000ns 王 20102ns, 传送 
1000 个 字 节 所 用 时 间 为 1000 X20102ns 一 20. 102ms。 因 此 , 中断 方 式 下 CPU 占用 时 间 的 


人 人 


百分比 约 为 1. 202/20. 102 一 5.98% 。 
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图 9.14 字符 型 设备 中 断 方式 下 的 MO 过 程 


(7) 根据 对 以 上 各 种 情况 的 分 析 , 可 以 得 到 以 下 4 个 结论 : 对 于 查询 方式 ,定时 查询 
比 独占 查询 的 CPU 利用 率 高 ,但 是 ,定时 查询 的 时 间 间 隔 必 须 和 外 设 的 数据 传输 率 和 接口 
缓存 情况 相 匹 配 。@ 对 于 快速 设备 ,因为 查询 方式 和 中 断 方式 的 CPU 开销 大 ,使 得 CPU 
来 不 及 处 理 外 设 传 输 的 数据 而 导致 数据 丢失 ,因而 快速 设备 不 能 采用 这 两 种 方式 。@ 对 于 
块 传送 设备 ,因为 不 需要 每 个 字 节 都 启动 一 次 外 设 , 所 以 ,传送 相同 字 节 个 数 所 用 的 时 间 比 
字符 型 设备 的 时 间 稍 短 。 例 如 ,对 于 1000 字 节 的 传送 ,独占 查询 方式 下 , 块 传送 设备 的 时 间 
是 20. 00104ms ,而 字符 型 设备 是 20. 02102ms; 中 断 方式 下 , 块 传送 设备 的 时 间 是 20ms, 而 
字符 型 设备 是 20.102ms。@ 外 设 速度 越 快 ,CPU 用 于 外 设 I/O 操作 的 时 间 所 占 比例 越 大 ， 
因此 ,对 于 快速 设备 ,应 尽量 减少 CPU 介入 1/O 的 程度 , 即 采用 DMA 方式 更 合适 。 

补充 说 明 : 在 计算 CPU 占用 时 间 百 分 比 时 也 可 用 另 一 种 方法 计算 得 到 。 例 如 ,对 于 
(3) 中 断 方式 的 计算 ,可 以 先 求 出 1 秒 钟 内 该 外 设 请 求 的 中 断 次 数 为 1/(1B/50kB) 二 50k, 然 
后 得 到 1 秒 钟 内 CPU 用 于 数据 I/O 的 时 钟 周期 数 为 50kX (2 十 1200) 二 6. 01X10’ ,因此 在 
该 设备 传输 过 程 中 , CPU 用 于 该 设备 IO 操作 的 时 间 占 整个 CPU 时 间 的 百分比 为 
6.01X10'/1G=6. 01%。 
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